Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt

Größe: px
Ab Seite anzeigen:

Download "Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org"

Transkript

1 Apache Lucene Mach s wie Google! Bernd Fondermann freier Software Architekt 1

2 Apache Apache Software Foundation Software free of charge Apache Software License Free + Open + Source Betonung liegt auf der Community problemlos in Closed Source verwendbar siehe ASF Session um 16:50 Uhr 2

3 Was macht Google, eigentlich? 3

4 ohne Freitextsuche Navigation in Bäumen Titel des gesuchten Dokumentes ist wesentlicher Anhaltspunkt öffnen vieler Dokumente, die nicht gesucht wurden zeitaufwendig alle Aktionen werden vom User ausgeführt Erwartungshaltung des Users: googeln 4

5 mit Freitextsuche alle Treffer auf einer Ebene, keine Bäume Treffer innerhalb von Dokumenten relevante Treffer sind schnell zugänglich Vorschau erlaubt direktes Filtern 5

6 Ablauf einer Freitextsuche vor der Suche (Computerprogramm) Texte (Webseiten) finden und einlesen (Crawler) Index aufbauen Index speichern und bereitstellen Webseite mit Suchformular 6

7 Ergebnis, inkl. Vorschau anzeigen 7 Ablauf einer Freitextsuche während der Suche Suchanfrage eingeben (User) Stichworte entgegennehmen (Computer) daraus eine Suchanfrage bilden Index durchsuchen (schnell!) Ergebnisse nach Relevanz sortieren

8 Lucene Produkte Apache Lucene Suchmaschinen- Framework, Index Apache Nutch Crawler + Indexer Apache Solr Suchmaschinen-Server 8

9 Apache Lucene Features Indizieren von beliebigen Business-Daten Ablage in speziellen Files Formulierung von Suchanfragen Durchführung der Suche (Finden) Rückgabe der Ergebnisse, Ranking 9

10 Eigene Daten einspeisen Text, Text, Text HTML, XML PDF, Office-Formate Product {Name, Datum, Beschreibung, Attribute, Typ} File {Name, Content, Kind-Files} 10

11 Sucheanfragen premium, top five pre*, pre~ premium special, premium OR special premium AND -name:premium datum:[ TO ] 11

12 Ergebnisaufbereitung Ranking der Ergebnisse Fundstellen in wichtigen Feldern: boosten Vorschau der Fundstellen in Fließtexten 12

13 Apache Nutch Crawler und Indexer folgt Links durchsucht HTML Seiten automatisch extrahiert die relevanten Informationen speist Ergebnisse in Lucene ein 13

14 Apache Solr Such-Server Komplettlösung Crawling, Indexing, Caching, Updating Administrations-Interface Optimierungen für High-Load Plug-in Architektur eigene Dokumente per XML einspeisen 14

15 Community & Support Lucene ist Quasi-Standard bei Such-APIs sehr aktives Projekt derzeit kein kommerzieller Service Support auf den öffentlichen Mailing-Listen Einfluß auf Projekt durch aktive Mitarbeit 15

16 Lucene Limits kein verteilter, replizierter Index keine Meinten Sie? Funktion keine Algorithmen zur schnellen Analyse großer Datenmengen 16

17 verwandte Apache Produkte Apache Hadoop Apache Hadoop Apache Mahout Apache Pig verteiltes Filesystem Map/Reduce Maschinenlernen Analyse großer Datenmengen 17

18 Apache Hadoop verteiltes, redundantes Filesystem HDFS verteilt über Rechner, Racks, Datacenter beliebig viele Live-Kopien, kein Offline- Backup nötig große Datenmengen, effizient laden verteilte Datenbank HBase Map/Reduce: Distributed Computing 18

19 Apache Mahout maschine learning neues Projekt implementiert herausragende ML- Algorithmen auf Basis von Map/Reduce experimentell = noch keine Integration in Lucene 19

20 ML-Algorithmen Meinten Sie? Autocompletion anhand der vielen Suchanfragen anhand der beliebtesten Suchanfragen Naive Bayes Spam-Detection 20

21 Vielen Dank! Fragen und Antworten 21

Apache Hadoop. Distribute your data and your application. Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.

Apache Hadoop. Distribute your data and your application. Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache. Apache Hadoop Distribute your data and your application Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org Apache The Apache Software Foundation Community und

Mehr

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr Peter Dikant mgm technology partners GmbH Echtzeitsuche mit Hadoop und Solr ECHTZEITSUCHE MIT HADOOP UND SOLR PETER DIKANT MGM TECHNOLOGY PARTNERS GMBH WHOAMI peter.dikant@mgm-tp.com Java Entwickler seit

Mehr

design kommunikation development

design kommunikation development http://www.dkd.de dkd design kommunikation development Apache Solr - A deeper look Stefan Sprenger, Developer dkd Olivier Dobberkau, Geschäftsführer dkd Agenda Einführung Boosting Empfehlungen Ausblick

Mehr

Apache Software Foundation

Apache Software Foundation Apache Software Foundation Leading the Wave of Open Source Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org 1 Wie alles begann 1996: Loser Zusammenschluß von

Mehr

Scandio SEBOL Search

Scandio SEBOL Search : : :, München Inhalt 1. Was ist SEBOL?...3 2. Index-Server...4 2.1. Warteschlange zur Indizierung...4 2.2. Plugin-Abarbeitung...4 2.3. Erweiterte Lucene-Indizierung...4 2.4. Index-Verteilung und Management...5

Mehr

Suche mit Apache Solr. Nader Cserny, compuccino

Suche mit Apache Solr. Nader Cserny, compuccino Suche mit Apache Solr Nader Cserny, compuccino Agenda Vorstellung Einführung Funktionen Beispiele Praxis Fragen Vorstellung Vorstellung Entwicklung, Design, Konzeption, Beratung Hamburg.de, BILD, WELT,

Mehr

Hadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes

Hadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes Hadoop Eine Open-Source-Implementierung von MapReduce und BigTable von Philipp Kemkes Hadoop Framework für skalierbare, verteilt arbeitende Software Zur Verarbeitung großer Datenmengen (Terra- bis Petabyte)

Mehr

Ontologiegestützte Suche in unstrukturierten Daten

Ontologiegestützte Suche in unstrukturierten Daten Ontologiegestützte Suche in unstrukturierten Daten Veranstalter: Prof. Dr. Lausen Betreuer: Kai Simon, Thomas Hornung (Team) Projekt Anforderungen Bachelor (6 ECTS) [entsprechen 180 Stunden] Softwareentwicklung

Mehr

Neue Ansätze der Softwarequalitätssicherung

Neue Ansätze der Softwarequalitätssicherung Neue Ansätze der Softwarequalitätssicherung Googles MapReduce-Framework für verteilte Berechnungen am Beispiel von Apache Hadoop Universität Paderborn Fakultät für Elektrotechnik, Informatik und Mathematik

Mehr

Big Data Hype und Wirklichkeit Bringtmehrauchmehr?

Big Data Hype und Wirklichkeit Bringtmehrauchmehr? Big Data Hype und Wirklichkeit Bringtmehrauchmehr? Günther Stürner, Vice President Sales Consulting 1 Copyright 2011, Oracle and/or its affiliates. All rights Überschrift 2 Copyright 2011, Oracle and/or

Mehr

Einführung in Hadoop

Einführung in Hadoop Einführung in Hadoop Inhalt / Lern-Ziele Übersicht: Basis-Architektur von Hadoop Einführung in HDFS Einführung in MapReduce Ausblick: Hadoop Ökosystem Optimierungen Versionen 10.02.2012 Prof. Dr. Christian

Mehr

Alternativen zur OpenText Suche. 29. OpenText Web Solutions Anwendertagung Mannheim, 18. Juni 2012 Sebastian Henne

Alternativen zur OpenText Suche. 29. OpenText Web Solutions Anwendertagung Mannheim, 18. Juni 2012 Sebastian Henne Alternativen zur OpenText Suche 29. OpenText Web Solutions Anwendertagung Mannheim, 18. Juni 2012 Sebastian Henne Übersicht Allgemeines zur Suche Die OpenText Common Search Indexierung ohne DeliveryServer

Mehr

Suchmaschinen mit Lucene und SEMS

Suchmaschinen mit Lucene und SEMS Suchmaschinen mit Lucene und SEMS lizenzfrei it consulting gmbh rainer dollinger dollinger@lizenzfrei.at www.lizenzfrei.at Vorstellung Unsere Schwerpunkte Beratung Umsetzung (z.b. Nagios, Lucene, Typo3)

Mehr

Sie haben Ihr Ziel erreicht

Sie haben Ihr Ziel erreicht Sie haben Ihr Ziel erreicht Innovative Weblösungen aus einer Hand. Sysgrade - intelligent internet. Agenda Überblick behalten! A) TYPO3 Standardsuche: indexed search Funktionsweise Vor- und Nachteile Erweiterungen

Mehr

Agenda. IT-Symposium 2007 19.04.2007. www.hp-user-society.de 1. Secure Enterprise Search. Suchen und finden mit Suchmaschinen. Oracle SES Überblick

Agenda. IT-Symposium 2007 19.04.2007. www.hp-user-society.de 1. Secure Enterprise Search. Suchen und finden mit Suchmaschinen. Oracle SES Überblick Secure Enterprise Search Das Intranet sicher durchsuchen Jürgen Vester, Snr. Manager Sales Consulting Stuttgart Agenda Suchen und finden mit Suchmaschinen Oracle SES Überblick Demo

Mehr

Website-Suche mit OpenText Web Site Management. Frank Steffen - Senior Product Manager

Website-Suche mit OpenText Web Site Management. Frank Steffen - Senior Product Manager Website-Suche mit OpenText Web Site Management Frank Steffen - Senior Product Manager Inhalt Überblick Konzepte der Suchmaschinenanbindung Verity K2 Anbindung Der neue OT Search Engine Connector Federated

Mehr

Jakarta Lucene. Eine Java-Bibliothek zur Suchindex-Erstellung. Seminararbeit Tilman Schneider

Jakarta Lucene. Eine Java-Bibliothek zur Suchindex-Erstellung. Seminararbeit Tilman Schneider Jakarta Lucene Eine Java-Bibliothek zur Suchindex-Erstellung Seminararbeit Tilman Schneider 2004 Tilman Schneider Seminararbeit: Jakarta Lucene Folie 1 Agenda Definition: Suchmaschine Vorstellung von Jakarta

Mehr

JSCMS Dokumentation. (Stand: 27.05.09)

JSCMS Dokumentation. (Stand: 27.05.09) JSCMS Dokumentation (Stand: 27.05.09) Inhalt: CMS Symbole und Funktionen. 2 Verwalten.. ab 3 Seiten Verwalten.. 4 Blöcke Verwalten....6 Templates Verwalten....7 Template Editor...8 Metatags bearbeiten..

Mehr

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013 Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien Berlin, Mai 2013 The unbelievable Machine Company? 06.05.13 The unbelievable Machine Company

Mehr

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur Suchmaschinen Anwendung RN Semester 7 Christian Koczur Inhaltsverzeichnis 1. Historischer Hintergrund 2. Information Retrieval 3. Architektur einer Suchmaschine 4. Ranking von Webseiten 5. Quellenangabe

Mehr

MapReduce in der Praxis

MapReduce in der Praxis MapReduce in der Praxis Rolf Daniel Seminar Multicore Programmierung 09.12.2010 1 / 53 Agenda Einleitung 1 Einleitung 2 3 Disco Hadoop BOOM 4 2 / 53 1 Einleitung 2 3 Disco Hadoop BOOM 4 3 / 53 Motivation

Mehr

Geschichte des Internets Suchmaschinen Fachinformationszentren. Institute for Science Networking

Geschichte des Internets Suchmaschinen Fachinformationszentren. Institute for Science Networking Geschichte des Internets Suchmaschinen Fachinformationszentren Kurze Geschichte des Internets Internet: Geschichte beginnt mit der Entwicklung paketvermittelter Netze. Bei der Paketvermittlung werden Nachrichten

Mehr

Willkommen. Projektidee. Informationsablage Docs Softwarelizenzen Meetingprotokolle

Willkommen. Projektidee. Informationsablage Docs Softwarelizenzen Meetingprotokolle Willkommen Cocoon InfoBase 1 Projektidee Informationsablage Docs Softwarelizenzen Meetingprotokolle Benutzer mit verschiedenen Rechten Benutzer kann Dokumente bearbeiten Ohne Verwendung einer Datenbank

Mehr

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters Suche, Suchmaschinen, Suchmaschinenoptimierung Workshop TYPO3 17.04.2012 Sybille Peters Sybille Peters Mitarbeiterin TYPO3 Team RRZN seit 4/2011 vorher im Suchmaschinenlabor des RRZN Seite 2 Überblick

Mehr

Einführung in das TYPO3 Content Management System. Jochen Weiland - jweiland.net

Einführung in das TYPO3 Content Management System. Jochen Weiland - jweiland.net Einführung in das TYPO3 Content Management System Dipl. Ing. Jochen Weiland jweiland.net Statische Websites upload Entwicklungsrechner Webserver Besucher Dynamische Websites Layouts Webserver Datenbank

Mehr

NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse

NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse Carsten Czarski Oracle Deutschland B.V. & Co KG Big Data Betrachten von Daten die bislang nicht betrachtet wurden

Mehr

Suchen und Finden mit Lucene und Solr. Florian Hopf 04.07.2012

Suchen und Finden mit Lucene und Solr. Florian Hopf 04.07.2012 Suchen und Finden mit Lucene und Solr Florian Hopf 04.07.2012 http://techcrunch.com/2010/08/04/schmidt-data/ Suche Go Suche Go Ergebnis 1 In Ergebnis 1 taucht der Suchbegriff auf... Ergebnis 2 In Ergebnis

Mehr

Google Caffeine. Was ist es, was ändert sich, wie bereite ich mich vor?

Google Caffeine. Was ist es, was ändert sich, wie bereite ich mich vor? Google Caffeine Was ist es, was ändert sich, wie bereite ich mich vor? Wer ist das? Johannes Beus, SISTRIX Suchmaschinenoptimierung seit 5 Monaten Betrieb eigener Webprojekte unterschiedlichster Themengebiete

Mehr

on Azure mit HDInsight & Script Ac2ons

on Azure mit HDInsight & Script Ac2ons Willkommen beim #GAB 2015! on Azure mit HDInsight & Script Ac2ons Lokale Sponsoren: HansPeter Grahsl Netconomy Entwickler & Berater FH CAMPUS 02 Twi9er: @hpgrahsl Überblick Inhalte Was ist HDInsight? Wozu

Mehr

Google Eine kurze Anleitung Stand: 3. August 2010

Google Eine kurze Anleitung Stand: 3. August 2010 Google Eine kurze Anleitung Stand: 3. August 2010 Nando Stöcklin, PHBern, Zentrum für Bildungsinformatik, bildungsinformatik.phbern.ch 1 Einleitung Das WWW besteht aus Milliarden von einzelnen Webseiten.

Mehr

www.geoportal.de deutschlandweit Geodaten finden und nutzen

www.geoportal.de deutschlandweit Geodaten finden und nutzen www.geoportal.de deutschlandweit Geodaten finden und nutzen Agenda Agenda Kurze Einführung Technische Umsetzung Geodatenkatalog-DE Mapserver Komponenten Geoportal.DE Mapbender3 Demo Einführung 2011 Geodatenkatalog-DE

Mehr

Search Evolution von Lucene zu Solr und ElasticSearch

Search Evolution von Lucene zu Solr und ElasticSearch Search Evolution von Lucene zu Solr und ElasticSearch 20.06.2013 Florian Hopf @fhopf http://www.florian-hopf.de Index Indizieren Index Suchen Index Term Document Id Analyzing http://www.flickr.com/photos/quinnanya/5196951914/

Mehr

Datenbearbeitung in der Cloud anhand von Apache Hadoop Hochschule Mannheim

Datenbearbeitung in der Cloud anhand von Apache Hadoop Hochschule Mannheim Tobias Neef Cloud-Computing Seminar Hochschule Mannheim WS0910 1/23 Datenbearbeitung in der Cloud anhand von Apache Hadoop Hochschule Mannheim Tobias Neef Fakultät für Informatik Hochschule Mannheim tobnee@gmail.com

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

Clouds. Erwartungen der Nutzer. Wolkig bis Heiter. (c) 2013, Peter Sturm, Universität Trier. Er ist verwöhnt! Er ist nicht dankbar!

Clouds. Erwartungen der Nutzer. Wolkig bis Heiter. (c) 2013, Peter Sturm, Universität Trier. Er ist verwöhnt! Er ist nicht dankbar! Clouds Wolkig bis Heiter Erwartungen der Nutzer Er ist verwöhnt! Verfügbarkeit Viele Anwendungen Intuitive Interfaces Hohe Leistung Er ist nicht dankbar! Mehr! Mehr! Mehr! Moore 1 Erwartungen der Entwickler

Mehr

Was ist Custom Search?

Was ist Custom Search? Custom Search Was ist Custom Search? Benutzerdefinierte Suchmaschine Eingrenzen der zu durchsuchenden Seiten oder Hervorheben priorisierter Seiten in der Websuche Gestaltung des Aussehens der Eingabeleiste

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

R im Enterprise-Modus

R im Enterprise-Modus R im Enterprise-Modus Skalierbarkeit, Support und unternehmensweiter Einsatz Dr. Eike Nicklas HMS Konferenz 2014 Was ist R? R is a free software environment for statistical computing and graphics - www.r-project.org

Mehr

Christian Meder & Andrew Kenworthy inovex. Lucenes Welt Ordnen, finden, klassifizieren

Christian Meder & Andrew Kenworthy inovex. Lucenes Welt Ordnen, finden, klassifizieren Christian Meder & Andrew Kenworthy inovex Lucenes Welt Ordnen, finden, klassifizieren Lucene's Welt: Ordnen, Finden, Klassifizieren JAX, 2012 Andrew Kenworthy Christian Meder inovex GmbH 19.04.2012 1 Speaker

Mehr

Einführung in das Schulportal

Einführung in das Schulportal Einführung in das Schulportal Inhalt I. Zugang zum Schulportal... 2 II. Nachrichten des Ministerialbeauftragten... 3 Abrufen von Nachrichten... 3 Suchen in den Nachrichten des MB... 3 Nachrichten lesen

Mehr

Typo3. Thomas Lüthi. Beitrag zur "CMS-Battle" vom 7. Juni 2010 Campus Bern. www.tomogramm.ch. http://campus.meteotest.ch/

Typo3. Thomas Lüthi. Beitrag zur CMS-Battle vom 7. Juni 2010 Campus Bern. www.tomogramm.ch. http://campus.meteotest.ch/ Typo3 Beitrag zur "CMS-Battle" vom 7. Juni 2010 Campus Bern http://campus.meteotest.ch/ Thomas Lüthi www.tomogramm.ch Mein Bezug zu Typo3 Ich verwende Typo3 seit 2007 Ich habe bisher ca. 20 Projekte damit

Mehr

!"#$"%&'()*$+()',!-+.'/',

!#$%&'()*$+()',!-+.'/', Soziotechnische Informationssysteme 5. Facebook, Google+ u.ä. Inhalte Historisches Relevanz Relevante Technologien Anwendungsarchitekturen 4(5,12316,7'.'0,!.80/6,9*$:'0+$.;.,&0$'0, 3, Historisches Facebook

Mehr

Full Text Search in Databases

Full Text Search in Databases Full Text Search in Databases Verfasser: Stefan Kainrath (0651066) h0651066@wu-wien.ac.at 0664/1327136 Betreuer: Dipl.-Ing. Mag. Dr. Albert Weichselbraun Inhaltsverzeichnis 1 Motivation... 3 2 Anforderungen...

Mehr

Content-Management- Systeme (CMS) Inhaltsverwaltungssystem, Redaktionssystem

Content-Management- Systeme (CMS) Inhaltsverwaltungssystem, Redaktionssystem Content-Management- Systeme (CMS) Inhaltsverwaltungssystem, Redaktionssystem Inhalt Content Management (CM) Allgemeines über CMS CMS Typen Open Source vs. Lizenzsoftware Joomla! Quellen Content Management

Mehr

Das Open Source CMS. Gregor Walter. gw@madgeniuses.net info@i-working.de

Das Open Source CMS. Gregor Walter. gw@madgeniuses.net info@i-working.de Das Open Source CMS Gregor Walter gw@madgeniuses.net info@i-working.de Übersicht Einführung und Geschichte von TYPO3 TYPO3 Features Für Webdesigner Für Redakteure TYPO3 Live - am Beispiel fiwm.de Seite

Mehr

MapReduce. Vereinfachte Datenverarbeitung in großen Rechnerverbünden. Igor Marijanovic 794894. Fachvortrag WAR 19.12.2012

MapReduce. Vereinfachte Datenverarbeitung in großen Rechnerverbünden. Igor Marijanovic 794894. Fachvortrag WAR 19.12.2012 MapReduce Vereinfachte Datenverarbeitung in großen Rechnerverbünden Igor Marijanovic 794894 Fachvortrag WAR 19.12.2012 Beuth Hochschule für Technik Berlin Inhalt Einleitung Hauptteil Abschluss MapReduce

Mehr

Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen

Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen Oracle DWH-Konferenz 21. März 2012 Dr. Carsten Bange Gründer & Geschäftsführer BARC Big Data bietet Methoden und Technologien

Mehr

Big Data. Prof. Robert Jäschke Forschungszentrum L3S Leibniz Universität Hannover

Big Data. Prof. Robert Jäschke Forschungszentrum L3S Leibniz Universität Hannover Big Data Prof. Robert Jäschke Forschungszentrum L3S Leibniz Universität Hannover Agenda Was ist Big Data? Parallele Programmierung Map/Reduce Der Big Data Zoo 2 3Vs oder: Was ist Big Data? Deutsche Telekom:

Mehr

Die Suche in Liferay Portal

Die Suche in Liferay Portal Die Suche in Liferay Portal Unternehmen brauchen für ihre Mitarbeiter Portale, die es ihnen ermöglichen, auf die verschiedenen relevanten Applikationen und deren Datenbestände schnell zuzugreifen. Eine

Mehr

Suchportale und Intranet- Suchmaschinen mit YaCy... und Beispiele von Anwendern

Suchportale und Intranet- Suchmaschinen mit YaCy... und Beispiele von Anwendern SearchEngine Suchportale und Intranet- Suchmaschinen mit YaCy... und Beispiele von Anwendern, mc@yacy.net open-it summit, 23.05.2013 Messegelände Berlin Abstract Search Appliances sind weit verbreitete

Mehr

Was hier fehlt? Enterprise Search mit der Intelligenz von Google. Jetzt von Kapsch.

Was hier fehlt? Enterprise Search mit der Intelligenz von Google. Jetzt von Kapsch. Kapsch BusinessCom DE Was hier fehlt? Enterprise Search mit der Intelligenz von Google. Jetzt von Kapsch. always one step ahead Gesucht? Bilder, Dokumente, Links, Personen, Dateien, Mails, Webseiten. Irgendwo

Mehr

Seminar Cloud Data Management WS09/10. Tabelle1 Tabelle2

Seminar Cloud Data Management WS09/10. Tabelle1 Tabelle2 Seminar Cloud Data Management WS09/10 Tabelle1 Tabelle2 1 Einführung DBMS in der Cloud Vergleich verschiedener DBMS Beispiele Microsoft Azure Amazon RDS Amazon EC2 Relational Databases AMIs Was gibt es

Mehr

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters Suche, Suchmaschinen, Suchmaschinenoptimierung Workshop TYPO3 17.04.2012 Sybille Peters Sybille Peters Mitarbeiterin TYPO3 Team RRZN seit 4/2011 vorher im Suchmaschinenlabor des RRZN Seite 2 Überblick

Mehr

Erfolgreich suchen im Internet

Erfolgreich suchen im Internet Erfolgreich suchen im Internet Steffen-Peter Ballstaedt 05.10.2015 Statistik Weltweit: etwa 1 Milliarde Websites BRD: 15 Millionen Websites Das Internet verdoppelt sich alle 5,32 Jahre Die häufigste Aktivität

Mehr

Maßgeschneiderte Suchmaschinen

Maßgeschneiderte Suchmaschinen Maßgeschneiderte Suchmaschinen Usability Stammtisch Frankfurt am Main 17.11.2009 Walter Ebert Web Development www.walterebert.de Braucht meine Website eine Suchmachine? Wahrscheinlich, wenn: Eine gute

Mehr

Frameworks zur Entwicklung von Suchmaschinen

Frameworks zur Entwicklung von Suchmaschinen Frameworks zur Entwicklung von Suchmaschinen Dipl.-Inf. Frank Hofmann 2. April 2007 Zielsetzung Fragen, die sich jeder stellt Wie funktioniert eine Suchmaschine? Warum finde ich eigentlich nicht das, was

Mehr

Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz

Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz 02_Grundlagen Lucene Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz Was ist Lucene? (1) Apache Lucene is a high-performance, full-featured text search engine library written

Mehr

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik ARFA ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik Ralf Leipner Domain Architect Analytics, Risk Management & Finance 33. Berner Architekten

Mehr

Bibliotheksprogramm (WebOPAC) Schritt-für-Schritt-Anleitung. ohne Ausleihe

Bibliotheksprogramm (WebOPAC) Schritt-für-Schritt-Anleitung. ohne Ausleihe Bibliotheksprogramm (WebOPAC) Schritt-für-Schritt-Anleitung ohne Ausleihe Inhaltsverzeichnis Titelsuche... 3 Einfache Suche... 4 Erweiterte Suche... 5 Aktionen in der Ergebnisliste der Suche... 6 Aktionen

Mehr

InfoPilot Die 4te Generation. InfoPilot 4 Warum sich ein Ein- oder Umstieg lohnen kann.

InfoPilot Die 4te Generation. InfoPilot 4 Warum sich ein Ein- oder Umstieg lohnen kann. InfoPilot Die 4te Generation InfoPilot 4 Warum sich ein Ein- oder Umstieg lohnen kann. Inhalt Zeitgemäßes Design der Oberfläche Kundenzufriedenheit verbessern, Neukundengewinnung erleichtern...3 Geänderte

Mehr

Google findet Teilen gut? Eine empirische Studie zum Einfluss von Facebook- Shares und Co. auf das organische Ranking von Suchmaschinen

Google findet Teilen gut? Eine empirische Studie zum Einfluss von Facebook- Shares und Co. auf das organische Ranking von Suchmaschinen Google findet Teilen gut? Eine empirische Studie zum Einfluss von Facebook- Shares und Co. auf das organische Ranking von Suchmaschinen Christin Hildebrandt / Christina Schumann / Jens Wolling Agenda Einführung

Mehr

BXE 2.0 The browser based Wysiwyg XML Editor

BXE 2.0 The browser based Wysiwyg XML Editor BXE 2.0 The browser based Wysiwyg XML Editor OpenExpo Frühling 2008, Bern Christian Stocker, Liip AG Agenda Einführung Technischer Überblick Case Study Demo Was ist BXE 2.0? Ein browser basierter XML Wysiwyg

Mehr

Übersicht. Grundidee des Indexing Lucene Wichtige Methoden und Klassen Lucene Indizierungsbeispiele Lucene Suchbeispiele Lucene QueryParser Syntax

Übersicht. Grundidee des Indexing Lucene Wichtige Methoden und Klassen Lucene Indizierungsbeispiele Lucene Suchbeispiele Lucene QueryParser Syntax Indizierung Lucene Übersicht Grundidee des Indexing Lucene Wichtige Methoden und Klassen Lucene Indizierungsbeispiele Lucene Suchbeispiele Lucene QueryParser Syntax Grundideen und Ziel des Indexing Effizientes

Mehr

Jakarta Turbine Ein Open Source Framework fÿr Webanwendungen. KNF Kongre 2001 Henning P. Schmiedehausen

Jakarta Turbine Ein Open Source Framework fÿr Webanwendungen. KNF Kongre 2001 Henning P. Schmiedehausen <henning@apache.org> Jakarta Turbine Ein Open Source Framework fÿr Webanwendungen Henning P. Schmiedehausen Turbine - ein berblick Open Source unter Apache License 100% pure Java, Java 2 (JDK 1.2+) Servlet-basiertes

Mehr

Big Data Informationen neu gelebt

Big Data Informationen neu gelebt Seminarunterlage Version: 1.01 Copyright Version 1.01 vom 21. Mai 2015 Dieses Dokument wird durch die veröffentlicht. Copyright. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen

Mehr

Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen

Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen DATA WAREHOUSE Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen Alfred Schlaucher, Detlef Schroeder DATA WAREHOUSE Themen Big Data Buzz Word oder eine neue Dimension

Mehr

Apache Solr. Apache Solr. ALD:HS WiSe 2011/2012. Einleitung. Features. Implementation. Verwaltung. Benutzung

Apache Solr. Apache Solr. ALD:HS WiSe 2011/2012. Einleitung. Features. Implementation. Verwaltung. Benutzung Universität zu Köln Sprachliche Informationsverarbeitung Hauptseminar: Angewandte linguistische Datenverarbeitung Dozent: Prof. Dr. Jürgen Rolshoven Referent: Patrick Pelinski 1 Gliederung Beschreibung,

Mehr

Benutzeranleitung emailarchiv.ch

Benutzeranleitung emailarchiv.ch Benutzeranleitung emailarchiv.ch Luzern, 14.03.2014 Inhalt 1 Zugriff... 3 2 Anmelden... 3 2.1 Anmeldung über den Browser... 3 2.2 Anmeldung über das Outlook Plug-In... 4 3 Das Mailarchiv... 5 3.1 Überblick...

Mehr

Hadoop. Simon Prewo. Simon Prewo

Hadoop. Simon Prewo. Simon Prewo Hadoop Simon Prewo Simon Prewo 1 Warum Hadoop? SQL: DB2, Oracle Hadoop? Innerhalb der letzten zwei Jahre hat sich die Datenmenge ca. verzehnfacht Die Klassiker wie DB2, Oracle usw. sind anders konzeptioniert

Mehr

BIG DATA HYPE ODER CHANCE

BIG DATA HYPE ODER CHANCE BIG DATA HYPE ODER CHANCE 1 Fuchs Dominik 16.05.2014 Fahrplan 2 Begriff Big Data Die 3 V s Fallbeispiel Google Was? Wie? Womit? Fazit & Ausblick in die Zukunft Der Begriff Big Data 3 Datenmengen, die zu

Mehr

Albert Dengg. Graz, 2013-04-24

Albert Dengg. Graz, 2013-04-24 1 / 14 Oder: System wirklich und was kann man tun um die Situation zu verbessern? Graz, 2013-04-24 2 / 14 Über meine Person Studiere Medizinische Informatik an der TU-Wien Arbeite seit 1998 mit GNU/Linux

Mehr

Recherchieren im Internet

Recherchieren im Internet Recherchieren im Internet Proseminar 1 Physik für Studierende des Lehramts Übersicht 1. Allgemeines zur Lage 2. google und mehr 3. Kataloge und Metasuchmaschinen 4. Fachspezifische Suchdienste 1. Allgemeines

Mehr

Was Google nicht findet gibt es nicht

Was Google nicht findet gibt es nicht Was Google nicht findet gibt es nicht Zur (Un-)Zulässigkeit der Treffer-Optimierung bei Suchmaschinen im Web 3.0 Dr. Hans Peter Wiesemann 5. Dialog Camp München, 19. Februar 2016 A. Einleitung A. Einleitung

Mehr

XINDICE. The Apache XML Project 3.12.09. Name: J acqueline Langhorst E-Mail: blackyuriko@hotmail.de

XINDICE. The Apache XML Project 3.12.09. Name: J acqueline Langhorst E-Mail: blackyuriko@hotmail.de Name: J acqueline Langhorst E-Mail: blackyuriko@hotmail.de 3.12.09 HKInformationsverarbeitung Kurs: Datenbanken vs. MarkUp WS 09/10 Dozent: Prof. Dr. M. Thaller XINDICE The Apache XML Project Inhalt Native

Mehr

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht Big-Data-Technologien - Überblick - Quelle: http://www.ingenieur.de/panorama/fussball-wm-in-brasilien/elektronischer-fussball-smartphone-app-helfen-training Big-Data-Anwendungen im Unternehmen Logistik

Mehr

Frameworks zur Entwicklung von Suchmaschinen

Frameworks zur Entwicklung von Suchmaschinen Frameworks zur Entwicklung von Suchmaschinen Dipl.-Inf. Frank Hofmann Potsdam 1. Juli 2007 Dipl.-Inf. Frank Hofmann (Potsdam) Frameworks zur Entwicklung von Suchmaschinen 1. Juli 2007 1 / 37 Zielsetzung

Mehr

PHRASEANET. Version 3.8 BENUTZER KURZANLEITUNG. Für mehrere Informationen, bitte besuchen Sie unsere offizielle Webseite: https://docs.phraseanet.

PHRASEANET. Version 3.8 BENUTZER KURZANLEITUNG. Für mehrere Informationen, bitte besuchen Sie unsere offizielle Webseite: https://docs.phraseanet. PHRASEANET Version 3.8 BENUTZER KURZANLEITUNG Für mehrere Informationen, bitte besuchen Sie unsere offizielle Webseite: https://docs.phraseanet.com INHALTSVERZEICHNIS : 1 EINLOGGEN 2 PHRASEANET MENÜLEISTE

Mehr

Suchen, um zu finden. Sta,s,k BRD (Quelle: Comscore, 2013) Beziehungsgeflecht der Suchmaschinen. Antworten auf folgende Fragen: 24.06.

Suchen, um zu finden. Sta,s,k BRD (Quelle: Comscore, 2013) Beziehungsgeflecht der Suchmaschinen. Antworten auf folgende Fragen: 24.06. Suchen, um zu finden Sta,s,k BRD (Quelle: Comscore, 2013) Steffen- Peter Ballstaedt 24.6.2015 etwa 6 Milliarden Suchanfragen pro Monat etwa 2.500 Anfragen pro Sekunde 96% der Suchanfragen über Google Beziehungsgeflecht

Mehr

Open Source Lösung Enterprise Search - Solr. Mit Solr Wissen suchen und schnell finden

Open Source Lösung Enterprise Search - Solr. Mit Solr Wissen suchen und schnell finden Open Source Lösung Enterprise Search - Solr Mit Solr Wissen suchen und schnell finden Enterprise Search suchen und schnell finden Kein Enterprise Portal ohne erfolgreiche Suche Portale bilden heute zentrale

Mehr

DaKirsche Desktop.ini Maker 2

DaKirsche Desktop.ini Maker 2 DaKirsche Desktop.ini Maker 2 Inhaltsverzeichnis Inhaltsverzeichnis... 2 Programminformationen... 3 Funktionalität... 3 Lizenz... 3 Programmaufbau... 4 Das Zielverzeichnis... 4 Die Verzeichniseinstellungen...

Mehr

Christian Koch Scandio GmbH 2010

Christian Koch Scandio GmbH 2010 Christian Koch Scandio GmbH 2010 Die Scandio GmbH mit ihrem Hauptsitz in München ist ein professionelles und erfahrenes Beratungs- und Dienstleistungsunternehmen im IT - Umfeld. Gründung: 2003 Geschäftsführer

Mehr

Managed Cloud Services

Managed Cloud Services Managed Cloud Services Autor.: Monika Olschewski Whitepaper Version: 1.0 Erstellt am: 14.07.2010 ADACOR Hosting GmbH Kaiserleistrasse 51 63067 Offenbach am Main info@adacor.com www.adacor.com Cloud Services

Mehr

Integration von XPhone Virtual Directory auf OpenStage 60/80 Telefonen

Integration von XPhone Virtual Directory auf OpenStage 60/80 Telefonen Integration von XPhone Virtual Directory auf OpenStage 60/80 Telefonen Inhaltsverzeichnis Dokumentenhistorie... 1 Allgemeine Informationen zu XPhone Virtual Directory... 1 XPhone Virtual Directory 2011

Mehr

Deep Web Suchen wir was man finden könnte?

Deep Web Suchen wir was man finden könnte? Deep Web Suchen wir was man finden könnte? Dr. Dirk Lewandowski dirk.lewandowski@uni-duesseldorf.de www.durchdenken.de/lewandowski Gliederung Die Bedeutung des Deep Web Die Größe des Deep Web Strategien

Mehr

BigTable. 11.12.2012 Else

BigTable. 11.12.2012 Else BigTable 11.12.2012 Else Einführung Distributed Storage System im Einsatz bei Google (2006) speichert strukturierte Daten petabyte-scale, > 1000 Nodes nicht relational, NoSQL setzt auf GFS auf 11.12.2012

Mehr

d e S I G n & d e v e L O P M e n T TYPO3 AdvAnced

d e S I G n & d e v e L O P M e n T TYPO3 AdvAnced DESIGN & DEVELOPMENT TYPO3 Advanced 1 Einleitung / Inhalt 2 / 13 Einleitung Dieses Dokument weist Sie durch die Funktion des Open Source CMS TYPO3. In wenigen, einfachen Schritten wird Ihnen bebildert

Mehr

RÖK Typo3 Dokumentation

RÖK Typo3 Dokumentation 2012 RÖK Typo3 Dokumentation Redakteur Sparten Eine Hilfe für den Einstieg in Typo3. Innpuls Werbeagentur GmbH 01.01.2012 2 RÖK Typo3 Dokumentation Inhalt 1) Was ist Typo3... 3 2) Typo3 aufrufen und Anmelden...

Mehr

Dateisysteme und Datenverwaltung in der Cloud

Dateisysteme und Datenverwaltung in der Cloud Dateisysteme und Datenverwaltung in der Cloud Sebastian Fischer Master-Seminar Cloud Computing - WS 2013/14 Institut für Telematik, Universität zu Lübeck Dateisysteme und Datenverwaltung in der Cloud 1

Mehr

neofonie DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR

neofonie DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR Suchportale der nächsten Generation Dr. Thomas Schwotzer Leiter Forschung, neofonie Suche eine Folien Geschichte 1993: Beginn der HTML-Ära 1993

Mehr

Storage-Trends am LRZ. Dr. Christoph Biardzki

Storage-Trends am LRZ. Dr. Christoph Biardzki Storage-Trends am LRZ Dr. Christoph Biardzki 1 Über das Leibniz-Rechenzentrum (LRZ) Seit 50 Jahren Rechenzentrum der Bayerischen Akademie der Wissenschaften IT-Dienstleister für Münchner Universitäten

Mehr

Technische Aspekte einer Videosuchmaschine. Björn Wilmsmann, CEO - MetaSieve GmbH

Technische Aspekte einer Videosuchmaschine. Björn Wilmsmann, CEO - MetaSieve GmbH Technische Aspekte einer Videosuchmaschine Björn Wilmsmann, CEO - MetaSieve GmbH 1 Über MetaSieve http://www.metasieve.com Softwareentwicklung Internet Software Spezialisiert auf Suchmaschinentechnologie

Mehr

ARBEITEN MIT DATEIEN UND ORDNERN IN WINDOW7

ARBEITEN MIT DATEIEN UND ORDNERN IN WINDOW7 ARBEITEN MIT DATEIEN UND ORDNERN IN WINDOW7 Bei einer Datei handelt es sich um ein Element mit enthaltenen Informationen wie Text, Bildern oder Musik. Eine geöffnet Datei kann große Ähnlichkeit mit einem

Mehr

Optionale Umstellung der Intranet-Version von Perinorm auf wöchentliche Aktualisierung

Optionale Umstellung der Intranet-Version von Perinorm auf wöchentliche Aktualisierung Optionale Umstellung der Intranet-Version von Perinorm auf wöchentliche Aktualisierung Perinorm Online wurde im Dezember 2013 auf eine wöchentliche Aktualisierung umgestellt. Ab April 2014 können auch

Mehr

Motivation Komponenten Konfiguration Modifikationen Suchmaschine Literatur. colibri Search. Eine Literatursuchmaschine für Fremdsprachenlerner

Motivation Komponenten Konfiguration Modifikationen Suchmaschine Literatur. colibri Search. Eine Literatursuchmaschine für Fremdsprachenlerner colibri Search Eine suchmaschine für Fremdsprachenlerner Seminar für Computerlinguistik Ruprecht-Karls-Universität Heidelberg 11. Januar 2010 Überblick 1 2 3 4 5 colibri Search colibri Search ist eine

Mehr

Einsatz von Lucene im BAM-Portal

Einsatz von Lucene im BAM-Portal Lucene Workshop Stuttgart 2006 Einsatz von Lucene im BAM-Portal Dipl. Phys. Thomas Kirchhoff Dipl. Inf. Christof Mainberger Stuttgart 24.01.2006 Motivation Wozu Lucene? Herkömmliche Suchtechnik mittels

Mehr

Aufbau und Vergleich webbasierter Suchmaschinen

Aufbau und Vergleich webbasierter Suchmaschinen Hochschule Neubrandenburg Studiengang Geoinformatik Aufbau und Vergleich webbasierter Suchmaschinen Bachelorarbeit vorgelegt von: Tino Schuldt Zum Erlangen des akademischen Grades Bachelor of Engineering

Mehr

Universitätsbibliothek. Technische Universität München. Internetsuche. Wissenswertes und Wissenschaftliches

Universitätsbibliothek. Technische Universität München. Internetsuche. Wissenswertes und Wissenschaftliches Internetsuche Wissenswertes und Wissenschaftliches 1. Allgemeine Suchmaschinen 2 Gezielter Suchen in Google Bestimmt nutzen Sie allgemeine Suchmaschinen (beinahe) täglich. Allerdings ist die Menge und

Mehr

Office SharePoint Server Suche anpassen und erweitern. Fabian Moritz Senior Consultant, SharePoint MVP ITaCS GmbH

Office SharePoint Server Suche anpassen und erweitern. Fabian Moritz Senior Consultant, SharePoint MVP ITaCS GmbH Office SharePoint Server Suche anpassen und erweitern Fabian Moritz Senior Consultant, SharePoint MVP ITaCS GmbH Agenda Topologie und Architektur der MOSS-Suche Crawling, Indexing, Quering? Was ist was?

Mehr

Erfahrungsbericht: Umstieg von RDBMS auf Big Data-Technologien

Erfahrungsbericht: Umstieg von RDBMS auf Big Data-Technologien Wir unternehmen IT. Erfahrungsbericht: Umstieg von RDBMS auf Big Data-Technologien Karlsruhe, 30.09.2015 $id thgreiner Thorsten Greiner Teamleiter Software Development ConSol* Software GmbH, Düsseldorf

Mehr

Installationsanleitung für. SugarCRM Open Source. Windows Einzelplatz

Installationsanleitung für. SugarCRM Open Source. Windows Einzelplatz Installationsanleitung für SugarCRM Open Source Windows Einzelplatz Inhaltsverzeichnis Systemvoraussetzungen... 3 WAMP5 Server... 3 Sugar CRM Open Source... 8 SugarCRM Dokumentation... 14 Deutsches Sprachpaket...

Mehr