Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org"

Transkript

1 Apache Lucene Mach s wie Google! Bernd Fondermann freier Software Architekt 1

2 Apache Apache Software Foundation Software free of charge Apache Software License Free + Open + Source Betonung liegt auf der Community problemlos in Closed Source verwendbar siehe ASF Session um 16:50 Uhr 2

3 Was macht Google, eigentlich? 3

4 ohne Freitextsuche Navigation in Bäumen Titel des gesuchten Dokumentes ist wesentlicher Anhaltspunkt öffnen vieler Dokumente, die nicht gesucht wurden zeitaufwendig alle Aktionen werden vom User ausgeführt Erwartungshaltung des Users: googeln 4

5 mit Freitextsuche alle Treffer auf einer Ebene, keine Bäume Treffer innerhalb von Dokumenten relevante Treffer sind schnell zugänglich Vorschau erlaubt direktes Filtern 5

6 Ablauf einer Freitextsuche vor der Suche (Computerprogramm) Texte (Webseiten) finden und einlesen (Crawler) Index aufbauen Index speichern und bereitstellen Webseite mit Suchformular 6

7 Ergebnis, inkl. Vorschau anzeigen 7 Ablauf einer Freitextsuche während der Suche Suchanfrage eingeben (User) Stichworte entgegennehmen (Computer) daraus eine Suchanfrage bilden Index durchsuchen (schnell!) Ergebnisse nach Relevanz sortieren

8 Lucene Produkte Apache Lucene Suchmaschinen- Framework, Index Apache Nutch Crawler + Indexer Apache Solr Suchmaschinen-Server 8

9 Apache Lucene Features Indizieren von beliebigen Business-Daten Ablage in speziellen Files Formulierung von Suchanfragen Durchführung der Suche (Finden) Rückgabe der Ergebnisse, Ranking 9

10 Eigene Daten einspeisen Text, Text, Text HTML, XML PDF, Office-Formate Product {Name, Datum, Beschreibung, Attribute, Typ} File {Name, Content, Kind-Files} 10

11 Sucheanfragen premium, top five pre*, pre~ premium special, premium OR special premium AND -name:premium datum:[ TO ] 11

12 Ergebnisaufbereitung Ranking der Ergebnisse Fundstellen in wichtigen Feldern: boosten Vorschau der Fundstellen in Fließtexten 12

13 Apache Nutch Crawler und Indexer folgt Links durchsucht HTML Seiten automatisch extrahiert die relevanten Informationen speist Ergebnisse in Lucene ein 13

14 Apache Solr Such-Server Komplettlösung Crawling, Indexing, Caching, Updating Administrations-Interface Optimierungen für High-Load Plug-in Architektur eigene Dokumente per XML einspeisen 14

15 Community & Support Lucene ist Quasi-Standard bei Such-APIs sehr aktives Projekt derzeit kein kommerzieller Service Support auf den öffentlichen Mailing-Listen Einfluß auf Projekt durch aktive Mitarbeit 15

16 Lucene Limits kein verteilter, replizierter Index keine Meinten Sie? Funktion keine Algorithmen zur schnellen Analyse großer Datenmengen 16

17 verwandte Apache Produkte Apache Hadoop Apache Hadoop Apache Mahout Apache Pig verteiltes Filesystem Map/Reduce Maschinenlernen Analyse großer Datenmengen 17

18 Apache Hadoop verteiltes, redundantes Filesystem HDFS verteilt über Rechner, Racks, Datacenter beliebig viele Live-Kopien, kein Offline- Backup nötig große Datenmengen, effizient laden verteilte Datenbank HBase Map/Reduce: Distributed Computing 18

19 Apache Mahout maschine learning neues Projekt implementiert herausragende ML- Algorithmen auf Basis von Map/Reduce experimentell = noch keine Integration in Lucene 19

20 ML-Algorithmen Meinten Sie? Autocompletion anhand der vielen Suchanfragen anhand der beliebtesten Suchanfragen Naive Bayes Spam-Detection 20

21 Vielen Dank! Fragen und Antworten 21

Apache Hadoop. Distribute your data and your application. Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.

Apache Hadoop. Distribute your data and your application. Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache. Apache Hadoop Distribute your data and your application Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org Apache The Apache Software Foundation Community und

Mehr

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr Peter Dikant mgm technology partners GmbH Echtzeitsuche mit Hadoop und Solr ECHTZEITSUCHE MIT HADOOP UND SOLR PETER DIKANT MGM TECHNOLOGY PARTNERS GMBH WHOAMI peter.dikant@mgm-tp.com Java Entwickler seit

Mehr

design kommunikation development

design kommunikation development http://www.dkd.de dkd design kommunikation development Apache Solr - A deeper look Stefan Sprenger, Developer dkd Olivier Dobberkau, Geschäftsführer dkd Agenda Einführung Boosting Empfehlungen Ausblick

Mehr

Apache Software Foundation

Apache Software Foundation Apache Software Foundation Leading the Wave of Open Source Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org 1 Wie alles begann 1996: Loser Zusammenschluß von

Mehr

Scandio SEBOL Search

Scandio SEBOL Search : : :, München Inhalt 1. Was ist SEBOL?...3 2. Index-Server...4 2.1. Warteschlange zur Indizierung...4 2.2. Plugin-Abarbeitung...4 2.3. Erweiterte Lucene-Indizierung...4 2.4. Index-Verteilung und Management...5

Mehr

Hadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes

Hadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes Hadoop Eine Open-Source-Implementierung von MapReduce und BigTable von Philipp Kemkes Hadoop Framework für skalierbare, verteilt arbeitende Software Zur Verarbeitung großer Datenmengen (Terra- bis Petabyte)

Mehr

Suche mit Apache Solr. Nader Cserny, compuccino

Suche mit Apache Solr. Nader Cserny, compuccino Suche mit Apache Solr Nader Cserny, compuccino Agenda Vorstellung Einführung Funktionen Beispiele Praxis Fragen Vorstellung Vorstellung Entwicklung, Design, Konzeption, Beratung Hamburg.de, BILD, WELT,

Mehr

Ontologiegestützte Suche in unstrukturierten Daten

Ontologiegestützte Suche in unstrukturierten Daten Ontologiegestützte Suche in unstrukturierten Daten Veranstalter: Prof. Dr. Lausen Betreuer: Kai Simon, Thomas Hornung (Team) Projekt Anforderungen Bachelor (6 ECTS) [entsprechen 180 Stunden] Softwareentwicklung

Mehr

Neue Ansätze der Softwarequalitätssicherung

Neue Ansätze der Softwarequalitätssicherung Neue Ansätze der Softwarequalitätssicherung Googles MapReduce-Framework für verteilte Berechnungen am Beispiel von Apache Hadoop Universität Paderborn Fakultät für Elektrotechnik, Informatik und Mathematik

Mehr

Einführung in Hadoop

Einführung in Hadoop Einführung in Hadoop Inhalt / Lern-Ziele Übersicht: Basis-Architektur von Hadoop Einführung in HDFS Einführung in MapReduce Ausblick: Hadoop Ökosystem Optimierungen Versionen 10.02.2012 Prof. Dr. Christian

Mehr

Alternativen zur OpenText Suche. 29. OpenText Web Solutions Anwendertagung Mannheim, 18. Juni 2012 Sebastian Henne

Alternativen zur OpenText Suche. 29. OpenText Web Solutions Anwendertagung Mannheim, 18. Juni 2012 Sebastian Henne Alternativen zur OpenText Suche 29. OpenText Web Solutions Anwendertagung Mannheim, 18. Juni 2012 Sebastian Henne Übersicht Allgemeines zur Suche Die OpenText Common Search Indexierung ohne DeliveryServer

Mehr

Sie haben Ihr Ziel erreicht

Sie haben Ihr Ziel erreicht Sie haben Ihr Ziel erreicht Innovative Weblösungen aus einer Hand. Sysgrade - intelligent internet. Agenda Überblick behalten! A) TYPO3 Standardsuche: indexed search Funktionsweise Vor- und Nachteile Erweiterungen

Mehr

Suchmaschinen mit Lucene und SEMS

Suchmaschinen mit Lucene und SEMS Suchmaschinen mit Lucene und SEMS lizenzfrei it consulting gmbh rainer dollinger dollinger@lizenzfrei.at www.lizenzfrei.at Vorstellung Unsere Schwerpunkte Beratung Umsetzung (z.b. Nagios, Lucene, Typo3)

Mehr

Big Data Hype und Wirklichkeit Bringtmehrauchmehr?

Big Data Hype und Wirklichkeit Bringtmehrauchmehr? Big Data Hype und Wirklichkeit Bringtmehrauchmehr? Günther Stürner, Vice President Sales Consulting 1 Copyright 2011, Oracle and/or its affiliates. All rights Überschrift 2 Copyright 2011, Oracle and/or

Mehr

JSCMS Dokumentation. (Stand: 27.05.09)

JSCMS Dokumentation. (Stand: 27.05.09) JSCMS Dokumentation (Stand: 27.05.09) Inhalt: CMS Symbole und Funktionen. 2 Verwalten.. ab 3 Seiten Verwalten.. 4 Blöcke Verwalten....6 Templates Verwalten....7 Template Editor...8 Metatags bearbeiten..

Mehr

Google Caffeine. Was ist es, was ändert sich, wie bereite ich mich vor?

Google Caffeine. Was ist es, was ändert sich, wie bereite ich mich vor? Google Caffeine Was ist es, was ändert sich, wie bereite ich mich vor? Wer ist das? Johannes Beus, SISTRIX Suchmaschinenoptimierung seit 5 Monaten Betrieb eigener Webprojekte unterschiedlichster Themengebiete

Mehr

Agenda. IT-Symposium 2007 19.04.2007. www.hp-user-society.de 1. Secure Enterprise Search. Suchen und finden mit Suchmaschinen. Oracle SES Überblick

Agenda. IT-Symposium 2007 19.04.2007. www.hp-user-society.de 1. Secure Enterprise Search. Suchen und finden mit Suchmaschinen. Oracle SES Überblick Secure Enterprise Search Das Intranet sicher durchsuchen Jürgen Vester, Snr. Manager Sales Consulting Stuttgart Agenda Suchen und finden mit Suchmaschinen Oracle SES Überblick Demo

Mehr

Geschichte des Internets Suchmaschinen Fachinformationszentren. Institute for Science Networking

Geschichte des Internets Suchmaschinen Fachinformationszentren. Institute for Science Networking Geschichte des Internets Suchmaschinen Fachinformationszentren Kurze Geschichte des Internets Internet: Geschichte beginnt mit der Entwicklung paketvermittelter Netze. Bei der Paketvermittlung werden Nachrichten

Mehr

Website-Suche mit OpenText Web Site Management. Frank Steffen - Senior Product Manager

Website-Suche mit OpenText Web Site Management. Frank Steffen - Senior Product Manager Website-Suche mit OpenText Web Site Management Frank Steffen - Senior Product Manager Inhalt Überblick Konzepte der Suchmaschinenanbindung Verity K2 Anbindung Der neue OT Search Engine Connector Federated

Mehr

Jakarta Lucene. Eine Java-Bibliothek zur Suchindex-Erstellung. Seminararbeit Tilman Schneider

Jakarta Lucene. Eine Java-Bibliothek zur Suchindex-Erstellung. Seminararbeit Tilman Schneider Jakarta Lucene Eine Java-Bibliothek zur Suchindex-Erstellung Seminararbeit Tilman Schneider 2004 Tilman Schneider Seminararbeit: Jakarta Lucene Folie 1 Agenda Definition: Suchmaschine Vorstellung von Jakarta

Mehr

Full Text Search in Databases

Full Text Search in Databases Full Text Search in Databases Verfasser: Stefan Kainrath (0651066) h0651066@wu-wien.ac.at 0664/1327136 Betreuer: Dipl.-Ing. Mag. Dr. Albert Weichselbraun Inhaltsverzeichnis 1 Motivation... 3 2 Anforderungen...

Mehr

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013 Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien Berlin, Mai 2013 The unbelievable Machine Company? 06.05.13 The unbelievable Machine Company

Mehr

MapReduce in der Praxis

MapReduce in der Praxis MapReduce in der Praxis Rolf Daniel Seminar Multicore Programmierung 09.12.2010 1 / 53 Agenda Einleitung 1 Einleitung 2 3 Disco Hadoop BOOM 4 2 / 53 1 Einleitung 2 3 Disco Hadoop BOOM 4 3 / 53 Motivation

Mehr

www.geoportal.de deutschlandweit Geodaten finden und nutzen

www.geoportal.de deutschlandweit Geodaten finden und nutzen www.geoportal.de deutschlandweit Geodaten finden und nutzen Agenda Agenda Kurze Einführung Technische Umsetzung Geodatenkatalog-DE Mapserver Komponenten Geoportal.DE Mapbender3 Demo Einführung 2011 Geodatenkatalog-DE

Mehr

Clouds. Erwartungen der Nutzer. Wolkig bis Heiter. (c) 2013, Peter Sturm, Universität Trier. Er ist verwöhnt! Er ist nicht dankbar!

Clouds. Erwartungen der Nutzer. Wolkig bis Heiter. (c) 2013, Peter Sturm, Universität Trier. Er ist verwöhnt! Er ist nicht dankbar! Clouds Wolkig bis Heiter Erwartungen der Nutzer Er ist verwöhnt! Verfügbarkeit Viele Anwendungen Intuitive Interfaces Hohe Leistung Er ist nicht dankbar! Mehr! Mehr! Mehr! Moore 1 Erwartungen der Entwickler

Mehr

Was hier fehlt? Enterprise Search mit der Intelligenz von Google. Jetzt von Kapsch.

Was hier fehlt? Enterprise Search mit der Intelligenz von Google. Jetzt von Kapsch. Kapsch BusinessCom DE Was hier fehlt? Enterprise Search mit der Intelligenz von Google. Jetzt von Kapsch. always one step ahead Gesucht? Bilder, Dokumente, Links, Personen, Dateien, Mails, Webseiten. Irgendwo

Mehr

R im Enterprise-Modus

R im Enterprise-Modus R im Enterprise-Modus Skalierbarkeit, Support und unternehmensweiter Einsatz Dr. Eike Nicklas HMS Konferenz 2014 Was ist R? R is a free software environment for statistical computing and graphics - www.r-project.org

Mehr

Suchen und Finden mit Lucene und Solr. Florian Hopf 04.07.2012

Suchen und Finden mit Lucene und Solr. Florian Hopf 04.07.2012 Suchen und Finden mit Lucene und Solr Florian Hopf 04.07.2012 http://techcrunch.com/2010/08/04/schmidt-data/ Suche Go Suche Go Ergebnis 1 In Ergebnis 1 taucht der Suchbegriff auf... Ergebnis 2 In Ergebnis

Mehr

Einführung in das TYPO3 Content Management System. Jochen Weiland - jweiland.net

Einführung in das TYPO3 Content Management System. Jochen Weiland - jweiland.net Einführung in das TYPO3 Content Management System Dipl. Ing. Jochen Weiland jweiland.net Statische Websites upload Entwicklungsrechner Webserver Besucher Dynamische Websites Layouts Webserver Datenbank

Mehr

Google Eine kurze Anleitung Stand: 3. August 2010

Google Eine kurze Anleitung Stand: 3. August 2010 Google Eine kurze Anleitung Stand: 3. August 2010 Nando Stöcklin, PHBern, Zentrum für Bildungsinformatik, bildungsinformatik.phbern.ch 1 Einleitung Das WWW besteht aus Milliarden von einzelnen Webseiten.

Mehr

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur Suchmaschinen Anwendung RN Semester 7 Christian Koczur Inhaltsverzeichnis 1. Historischer Hintergrund 2. Information Retrieval 3. Architektur einer Suchmaschine 4. Ranking von Webseiten 5. Quellenangabe

Mehr

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik ARFA ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik Ralf Leipner Domain Architect Analytics, Risk Management & Finance 33. Berner Architekten

Mehr

SUCHMASCHINEN XAPIAN. Michael Strzempek FH Wiesbaden, 5. Juni 2008

SUCHMASCHINEN XAPIAN. Michael Strzempek FH Wiesbaden, 5. Juni 2008 SUCHMASCHINEN XAPIAN Michael Strzempek FH Wiesbaden, 5. Juni 2008 INHALT 1. Motivation 2. Prinzip / Vokabular 3. Xapian 4. Omega 5. Datenbank Indizierung 6. Levenshtein Distanz 7. Boolesche Suche 8. Probabilistische

Mehr

d e S I G n & d e v e L O P M e n T TYPO3 AdvAnced

d e S I G n & d e v e L O P M e n T TYPO3 AdvAnced DESIGN & DEVELOPMENT TYPO3 Advanced 1 Einleitung / Inhalt 2 / 13 Einleitung Dieses Dokument weist Sie durch die Funktion des Open Source CMS TYPO3. In wenigen, einfachen Schritten wird Ihnen bebildert

Mehr

Webspider. Dr. Christian Herta. June 11, von 14 Dr. Christian Herta Webspider

Webspider. Dr. Christian Herta. June 11, von 14 Dr. Christian Herta Webspider Webspider Dr. Christian Herta June 11, 2009 1 von 14 Dr. Christian Herta Webspider Referenz-Architektur: Mercator Referenz-Architektur: Webcrawler Mercator [2] modular und Komponenten-basiert, so wird

Mehr

Das Open Source CMS. Gregor Walter. gw@madgeniuses.net info@i-working.de

Das Open Source CMS. Gregor Walter. gw@madgeniuses.net info@i-working.de Das Open Source CMS Gregor Walter gw@madgeniuses.net info@i-working.de Übersicht Einführung und Geschichte von TYPO3 TYPO3 Features Für Webdesigner Für Redakteure TYPO3 Live - am Beispiel fiwm.de Seite

Mehr

Search Evolution von Lucene zu Solr und ElasticSearch

Search Evolution von Lucene zu Solr und ElasticSearch Search Evolution von Lucene zu Solr und ElasticSearch 20.06.2013 Florian Hopf @fhopf http://www.florian-hopf.de Index Indizieren Index Suchen Index Term Document Id Analyzing http://www.flickr.com/photos/quinnanya/5196951914/

Mehr

Willkommen. Projektidee. Informationsablage Docs Softwarelizenzen Meetingprotokolle

Willkommen. Projektidee. Informationsablage Docs Softwarelizenzen Meetingprotokolle Willkommen Cocoon InfoBase 1 Projektidee Informationsablage Docs Softwarelizenzen Meetingprotokolle Benutzer mit verschiedenen Rechten Benutzer kann Dokumente bearbeiten Ohne Verwendung einer Datenbank

Mehr

Datenbearbeitung in der Cloud anhand von Apache Hadoop Hochschule Mannheim

Datenbearbeitung in der Cloud anhand von Apache Hadoop Hochschule Mannheim Tobias Neef Cloud-Computing Seminar Hochschule Mannheim WS0910 1/23 Datenbearbeitung in der Cloud anhand von Apache Hadoop Hochschule Mannheim Tobias Neef Fakultät für Informatik Hochschule Mannheim tobnee@gmail.com

Mehr

Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen

Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen Oracle DWH-Konferenz 21. März 2012 Dr. Carsten Bange Gründer & Geschäftsführer BARC Big Data bietet Methoden und Technologien

Mehr

Big Data Informationen neu gelebt

Big Data Informationen neu gelebt Seminarunterlage Version: 1.01 Copyright Version 1.01 vom 21. Mai 2015 Dieses Dokument wird durch die veröffentlicht. Copyright. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen

Mehr

NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse

NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse Carsten Czarski Oracle Deutschland B.V. & Co KG Big Data Betrachten von Daten die bislang nicht betrachtet wurden

Mehr

Christian Meder & Andrew Kenworthy inovex. Lucenes Welt Ordnen, finden, klassifizieren

Christian Meder & Andrew Kenworthy inovex. Lucenes Welt Ordnen, finden, klassifizieren Christian Meder & Andrew Kenworthy inovex Lucenes Welt Ordnen, finden, klassifizieren Lucene's Welt: Ordnen, Finden, Klassifizieren JAX, 2012 Andrew Kenworthy Christian Meder inovex GmbH 19.04.2012 1 Speaker

Mehr

Typo3. Thomas Lüthi. Beitrag zur "CMS-Battle" vom 7. Juni 2010 Campus Bern. www.tomogramm.ch. http://campus.meteotest.ch/

Typo3. Thomas Lüthi. Beitrag zur CMS-Battle vom 7. Juni 2010 Campus Bern. www.tomogramm.ch. http://campus.meteotest.ch/ Typo3 Beitrag zur "CMS-Battle" vom 7. Juni 2010 Campus Bern http://campus.meteotest.ch/ Thomas Lüthi www.tomogramm.ch Mein Bezug zu Typo3 Ich verwende Typo3 seit 2007 Ich habe bisher ca. 20 Projekte damit

Mehr

XINDICE. The Apache XML Project 3.12.09. Name: J acqueline Langhorst E-Mail: blackyuriko@hotmail.de

XINDICE. The Apache XML Project 3.12.09. Name: J acqueline Langhorst E-Mail: blackyuriko@hotmail.de Name: J acqueline Langhorst E-Mail: blackyuriko@hotmail.de 3.12.09 HKInformationsverarbeitung Kurs: Datenbanken vs. MarkUp WS 09/10 Dozent: Prof. Dr. M. Thaller XINDICE The Apache XML Project Inhalt Native

Mehr

Jakarta Turbine Ein Open Source Framework fÿr Webanwendungen. KNF Kongre 2001 Henning P. Schmiedehausen

Jakarta Turbine Ein Open Source Framework fÿr Webanwendungen. KNF Kongre 2001 Henning P. Schmiedehausen <henning@apache.org> Jakarta Turbine Ein Open Source Framework fÿr Webanwendungen Henning P. Schmiedehausen Turbine - ein berblick Open Source unter Apache License 100% pure Java, Java 2 (JDK 1.2+) Servlet-basiertes

Mehr

on Azure mit HDInsight & Script Ac2ons

on Azure mit HDInsight & Script Ac2ons Willkommen beim #GAB 2015! on Azure mit HDInsight & Script Ac2ons Lokale Sponsoren: HansPeter Grahsl Netconomy Entwickler & Berater FH CAMPUS 02 Twi9er: @hpgrahsl Überblick Inhalte Was ist HDInsight? Wozu

Mehr

MATCHING VON PRODUKTDATEN IN DER CLOUD

MATCHING VON PRODUKTDATEN IN DER CLOUD MATCHING VON PRODUKTDATEN IN DER CLOUD Dr. Andreas Thor Universität Leipzig 15.12.2011 Web Data Integration Workshop 2011 Cloud Computing 2 Cloud computing is using the internet to access someone else's

Mehr

Benutzeranleitung emailarchiv.ch

Benutzeranleitung emailarchiv.ch Benutzeranleitung emailarchiv.ch Luzern, 14.03.2014 Inhalt 1 Zugriff... 3 2 Anmelden... 3 2.1 Anmeldung über den Browser... 3 2.2 Anmeldung über das Outlook Plug-In... 4 3 Das Mailarchiv... 5 3.1 Überblick...

Mehr

Update Information. Independence Pro Software Suite 3.0 & Sound Libraries

Update Information. Independence Pro Software Suite 3.0 & Sound Libraries Update Information Independence Pro Software Suite 3.0 & Sound Libraries 2 Yellow Tools Update Information Lieber Kunde, vielen Dank, dass Du Dich für eines unserer Produkte entschieden hast! Falls Du

Mehr

InfoPilot Die 4te Generation. InfoPilot 4 Warum sich ein Ein- oder Umstieg lohnen kann.

InfoPilot Die 4te Generation. InfoPilot 4 Warum sich ein Ein- oder Umstieg lohnen kann. InfoPilot Die 4te Generation InfoPilot 4 Warum sich ein Ein- oder Umstieg lohnen kann. Inhalt Zeitgemäßes Design der Oberfläche Kundenzufriedenheit verbessern, Neukundengewinnung erleichtern...3 Geänderte

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

Maßgeschneiderte Suchmaschinen

Maßgeschneiderte Suchmaschinen Maßgeschneiderte Suchmaschinen Usability Stammtisch Frankfurt am Main 17.11.2009 Walter Ebert Web Development www.walterebert.de Braucht meine Website eine Suchmachine? Wahrscheinlich, wenn: Eine gute

Mehr

Was ist MODX Revolution?

Was ist MODX Revolution? FACT SHEET 1 Was ist MODX Revolution? MODX ist ein Content Management System (CMS) und ein Applikations-Framework. MODX ist schon seit der Version Evolution ein Open Source Projekt und wird dank einer

Mehr

Albert Dengg. Graz, 2013-04-24

Albert Dengg. Graz, 2013-04-24 1 / 14 Oder: System wirklich und was kann man tun um die Situation zu verbessern? Graz, 2013-04-24 2 / 14 Über meine Person Studiere Medizinische Informatik an der TU-Wien Arbeite seit 1998 mit GNU/Linux

Mehr

CAS genesisworld.exchange connect Abgleich von Adressen und Terminen

CAS genesisworld.exchange connect Abgleich von Adressen und Terminen Abgleich von Adressen und Terminen Stand Juni 2004 Was ist CAS genesisworld.exchange connect? Inhalt 1 Was ist CAS genesisworld.exchange connect?... 3 2 Systemvoraussetzungen... 5 2.1 Software...5 2.2

Mehr

Bibliotheksprogramm (WebOPAC) Schritt-für-Schritt-Anleitung. ohne Ausleihe

Bibliotheksprogramm (WebOPAC) Schritt-für-Schritt-Anleitung. ohne Ausleihe Bibliotheksprogramm (WebOPAC) Schritt-für-Schritt-Anleitung ohne Ausleihe Inhaltsverzeichnis Titelsuche... 3 Einfache Suche... 4 Erweiterte Suche... 5 Aktionen in der Ergebnisliste der Suche... 6 Aktionen

Mehr

Apache Solr. Apache Solr. ALD:HS WiSe 2011/2012. Einleitung. Features. Implementation. Verwaltung. Benutzung

Apache Solr. Apache Solr. ALD:HS WiSe 2011/2012. Einleitung. Features. Implementation. Verwaltung. Benutzung Universität zu Köln Sprachliche Informationsverarbeitung Hauptseminar: Angewandte linguistische Datenverarbeitung Dozent: Prof. Dr. Jürgen Rolshoven Referent: Patrick Pelinski 1 Gliederung Beschreibung,

Mehr

BXE 2.0 The browser based Wysiwyg XML Editor

BXE 2.0 The browser based Wysiwyg XML Editor BXE 2.0 The browser based Wysiwyg XML Editor OpenExpo Frühling 2008, Bern Christian Stocker, Liip AG Agenda Einführung Technischer Überblick Case Study Demo Was ist BXE 2.0? Ein browser basierter XML Wysiwyg

Mehr

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters Suche, Suchmaschinen, Suchmaschinenoptimierung Workshop TYPO3 17.04.2012 Sybille Peters Sybille Peters Mitarbeiterin TYPO3 Team RRZN seit 4/2011 vorher im Suchmaschinenlabor des RRZN Seite 2 Überblick

Mehr

Übersicht. Grundidee des Indexing Lucene Wichtige Methoden und Klassen Lucene Indizierungsbeispiele Lucene Suchbeispiele Lucene QueryParser Syntax

Übersicht. Grundidee des Indexing Lucene Wichtige Methoden und Klassen Lucene Indizierungsbeispiele Lucene Suchbeispiele Lucene QueryParser Syntax Indizierung Lucene Übersicht Grundidee des Indexing Lucene Wichtige Methoden und Klassen Lucene Indizierungsbeispiele Lucene Suchbeispiele Lucene QueryParser Syntax Grundideen und Ziel des Indexing Effizientes

Mehr

Die Suche in Liferay Portal

Die Suche in Liferay Portal Die Suche in Liferay Portal Unternehmen brauchen für ihre Mitarbeiter Portale, die es ihnen ermöglichen, auf die verschiedenen relevanten Applikationen und deren Datenbestände schnell zuzugreifen. Eine

Mehr

!"#$"%&'()*$+()',!-+.'/',

!#$%&'()*$+()',!-+.'/', Soziotechnische Informationssysteme 5. Facebook, Google+ u.ä. Inhalte Historisches Relevanz Relevante Technologien Anwendungsarchitekturen 4(5,12316,7'.'0,!.80/6,9*$:'0+$.;.,&0$'0, 3, Historisches Facebook

Mehr

Was ist Custom Search?

Was ist Custom Search? Custom Search Was ist Custom Search? Benutzerdefinierte Suchmaschine Eingrenzen der zu durchsuchenden Seiten oder Hervorheben priorisierter Seiten in der Websuche Gestaltung des Aussehens der Eingabeleiste

Mehr

Die Cargo Plattform bietet einen sicheren und einfachen Datentransfer mit einem modernen Web- Interface.

Die Cargo Plattform bietet einen sicheren und einfachen Datentransfer mit einem modernen Web- Interface. Die Cargo Plattform bietet einen sicheren und einfachen Datentransfer mit einem modernen Web- Interface. Inhaltsverzeichnis Erste Schritte Anmelden 2 Startseite 3 Dateimanager 4 CargoLink 5 Freigaben 6

Mehr

Integration von XPhone Virtual Directory auf OpenStage 60/80 Telefonen

Integration von XPhone Virtual Directory auf OpenStage 60/80 Telefonen Integration von XPhone Virtual Directory auf OpenStage 60/80 Telefonen Inhaltsverzeichnis Dokumentenhistorie... 1 Allgemeine Informationen zu XPhone Virtual Directory... 1 XPhone Virtual Directory 2011

Mehr

Content-Management- Systeme (CMS) Inhaltsverwaltungssystem, Redaktionssystem

Content-Management- Systeme (CMS) Inhaltsverwaltungssystem, Redaktionssystem Content-Management- Systeme (CMS) Inhaltsverwaltungssystem, Redaktionssystem Inhalt Content Management (CM) Allgemeines über CMS CMS Typen Open Source vs. Lizenzsoftware Joomla! Quellen Content Management

Mehr

neofonie DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR

neofonie DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR Suchportale der nächsten Generation Dr. Thomas Schwotzer Leiter Forschung, neofonie Suche eine Folien Geschichte 1993: Beginn der HTML-Ära 1993

Mehr

Christian Koch Scandio GmbH 2010

Christian Koch Scandio GmbH 2010 Christian Koch Scandio GmbH 2010 Die Scandio GmbH mit ihrem Hauptsitz in München ist ein professionelles und erfahrenes Beratungs- und Dienstleistungsunternehmen im IT - Umfeld. Gründung: 2003 Geschäftsführer

Mehr

Big Data. Prof. Robert Jäschke Forschungszentrum L3S Leibniz Universität Hannover

Big Data. Prof. Robert Jäschke Forschungszentrum L3S Leibniz Universität Hannover Big Data Prof. Robert Jäschke Forschungszentrum L3S Leibniz Universität Hannover Agenda Was ist Big Data? Parallele Programmierung Map/Reduce Der Big Data Zoo 2 3Vs oder: Was ist Big Data? Deutsche Telekom:

Mehr

Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen

Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen DATA WAREHOUSE Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen Alfred Schlaucher, Detlef Schroeder DATA WAREHOUSE Themen Big Data Buzz Word oder eine neue Dimension

Mehr

Einführung in das Schulportal

Einführung in das Schulportal Einführung in das Schulportal Inhalt I. Zugang zum Schulportal... 2 II. Nachrichten des Ministerialbeauftragten... 3 Abrufen von Nachrichten... 3 Suchen in den Nachrichten des MB... 3 Nachrichten lesen

Mehr

Apache HBase. A BigTable Column Store on top of Hadoop

Apache HBase. A BigTable Column Store on top of Hadoop Apache HBase A BigTable Column Store on top of Hadoop Ich bin... Mitch Köhler Selbstständig seit 2010 Tätig als Softwareentwickler Softwarearchitekt Student an der OVGU seit Oktober 2011 Schwerpunkte Client/Server,

Mehr

BIG DATA HYPE ODER CHANCE

BIG DATA HYPE ODER CHANCE BIG DATA HYPE ODER CHANCE 1 Fuchs Dominik 16.05.2014 Fahrplan 2 Begriff Big Data Die 3 V s Fallbeispiel Google Was? Wie? Womit? Fazit & Ausblick in die Zukunft Der Begriff Big Data 3 Datenmengen, die zu

Mehr

5. Programmierschnittstellen für XML

5. Programmierschnittstellen für XML 5. Programmierschnittstellen für Grundlagen Dr. E. Schön FH Erfurt Sommersemester 2015 Seite 135 Programmierschnittstelle Notwendigkeit: Zugriff auf -Daten durch Applikationen wiederverwendbare Schnittstellen

Mehr

MapReduce. Vereinfachte Datenverarbeitung in großen Rechnerverbünden. Igor Marijanovic 794894. Fachvortrag WAR 19.12.2012

MapReduce. Vereinfachte Datenverarbeitung in großen Rechnerverbünden. Igor Marijanovic 794894. Fachvortrag WAR 19.12.2012 MapReduce Vereinfachte Datenverarbeitung in großen Rechnerverbünden Igor Marijanovic 794894 Fachvortrag WAR 19.12.2012 Beuth Hochschule für Technik Berlin Inhalt Einleitung Hauptteil Abschluss MapReduce

Mehr

5. Programmierschnittstellen für XML

5. Programmierschnittstellen für XML 5. Programmierschnittstellen für für Medientechnologen Dr. E. Schön Wintersemester 2015/16 Seite 146 Notwendigkeit: Programmierschnittstelle Zugriff auf -Daten durch Applikationen wiederverwendbare Schnittstellen

Mehr

Optimale Website-Architektur Suchmaschinenmarketing Kongress 2006

Optimale Website-Architektur Suchmaschinenmarketing Kongress 2006 blog.namics.com Optimale Website-Architektur Suchmaschinenmarketing Kongress 2006 Zürich, 14. Juni 2006 Jürg Stuker, CEO & Partner Bern, Frankfurt, Hamburg, München, St. Gallen, Zug, Zürich Ausgangslage

Mehr

Gesucht und Gefunden: Die Funktionsweise einer Suchmaschine

Gesucht und Gefunden: Die Funktionsweise einer Suchmaschine Gesucht und Gefunden: Die Funktionsweise einer Suchmaschine Prof. Dr. Peter Becker FH Bonn-Rhein-Sieg Fachbereich Informatik peter.becker@fh-bonn-rhein-sieg.de Vortrag im Rahmen des Studieninformationstags

Mehr

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters Suche, Suchmaschinen, Suchmaschinenoptimierung Workshop TYPO3 17.04.2012 Sybille Peters Sybille Peters Mitarbeiterin TYPO3 Team RRZN seit 4/2011 vorher im Suchmaschinenlabor des RRZN Seite 2 Überblick

Mehr

Frameworks zur Entwicklung von Suchmaschinen

Frameworks zur Entwicklung von Suchmaschinen Frameworks zur Entwicklung von Suchmaschinen Dipl.-Inf. Frank Hofmann 2. April 2007 Zielsetzung Fragen, die sich jeder stellt Wie funktioniert eine Suchmaschine? Warum finde ich eigentlich nicht das, was

Mehr

Suchportale und Intranet- Suchmaschinen mit YaCy... und Beispiele von Anwendern

Suchportale und Intranet- Suchmaschinen mit YaCy... und Beispiele von Anwendern SearchEngine Suchportale und Intranet- Suchmaschinen mit YaCy... und Beispiele von Anwendern, mc@yacy.net open-it summit, 23.05.2013 Messegelände Berlin Abstract Search Appliances sind weit verbreitete

Mehr

Optionale Umstellung der Intranet-Version von Perinorm auf wöchentliche Aktualisierung

Optionale Umstellung der Intranet-Version von Perinorm auf wöchentliche Aktualisierung Optionale Umstellung der Intranet-Version von Perinorm auf wöchentliche Aktualisierung Perinorm Online wurde im Dezember 2013 auf eine wöchentliche Aktualisierung umgestellt. Ab April 2014 können auch

Mehr

Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz

Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz 02_Grundlagen Lucene Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz Was ist Lucene? (1) Apache Lucene is a high-performance, full-featured text search engine library written

Mehr

PHRASEANET. Version 3.8 BENUTZER KURZANLEITUNG. Für mehrere Informationen, bitte besuchen Sie unsere offizielle Webseite: https://docs.phraseanet.

PHRASEANET. Version 3.8 BENUTZER KURZANLEITUNG. Für mehrere Informationen, bitte besuchen Sie unsere offizielle Webseite: https://docs.phraseanet. PHRASEANET Version 3.8 BENUTZER KURZANLEITUNG Für mehrere Informationen, bitte besuchen Sie unsere offizielle Webseite: https://docs.phraseanet.com INHALTSVERZEICHNIS : 1 EINLOGGEN 2 PHRASEANET MENÜLEISTE

Mehr

BIF/SWE 1 - Übungsbeispiel

BIF/SWE 1 - Übungsbeispiel Arthur Zaczek Sep 2015 1 Übungsbeispiel embedded sensor cloud 1.1 Aufgabenstellung Auf einem [[tragen Sie bitte hier Ihr Embedded System Ihrer Wahl ein]] soll ein Messdaten Erfassungssystem implementiert

Mehr

Advanced Event Handling

Advanced Event Handling Advanced Event Handling Michael Streb NETWAYS GmbH Agenda Was sind für uns Events? Entstehung der EventDB Ablösung der bisherigen Systeme bisher keine einfache Lösung Konsolidierung verschiedener Systeme

Mehr

Erfolgreich suchen im Internet

Erfolgreich suchen im Internet Erfolgreich suchen im Internet Steffen-Peter Ballstaedt 05.10.2015 Statistik Weltweit: etwa 1 Milliarde Websites BRD: 15 Millionen Websites Das Internet verdoppelt sich alle 5,32 Jahre Die häufigste Aktivität

Mehr

RÖK Typo3 Dokumentation

RÖK Typo3 Dokumentation 2012 RÖK Typo3 Dokumentation Redakteur Sparten Eine Hilfe für den Einstieg in Typo3. Innpuls Werbeagentur GmbH 01.01.2012 2 RÖK Typo3 Dokumentation Inhalt 1) Was ist Typo3... 3 2) Typo3 aufrufen und Anmelden...

Mehr

Schweizerisches Bundesgericht

Schweizerisches Bundesgericht Schweizerisches Bundesgericht 10 Jahre Open Source OfficeEinsatz am höchsten Gericht der Schweiz Daniel Brunner Bern, 3. September 2014 Agenda Das Schweizerische Bundesgericht IT & OSS-Strategie des Bundesgerichts

Mehr

Was Google nicht findet gibt es nicht

Was Google nicht findet gibt es nicht Was Google nicht findet gibt es nicht Zur (Un-)Zulässigkeit der Treffer-Optimierung bei Suchmaschinen im Web 3.0 Dr. Hans Peter Wiesemann 5. Dialog Camp München, 19. Februar 2016 A. Einleitung A. Einleitung

Mehr

In 5 Klicks zum Vorlesungsverzeichnis Stud.IP und TYPO3 integriert

In 5 Klicks zum Vorlesungsverzeichnis Stud.IP und TYPO3 integriert In 5 Klicks zum Vorlesungsverzeichnis Stud.IP und TYPO3 integriert Thomas Hackl http://www.intelec.de Was ist TYPO3? Content Management System Erlaubt komfortable Verwaltung von Webseiten Automatische

Mehr

Managed Cloud Services

Managed Cloud Services Managed Cloud Services Autor.: Monika Olschewski Whitepaper Version: 1.0 Erstellt am: 14.07.2010 ADACOR Hosting GmbH Kaiserleistrasse 51 63067 Offenbach am Main info@adacor.com www.adacor.com Cloud Services

Mehr

Einsatz von Lucene im BAM-Portal

Einsatz von Lucene im BAM-Portal Lucene Workshop Stuttgart 2006 Einsatz von Lucene im BAM-Portal Dipl. Phys. Thomas Kirchhoff Dipl. Inf. Christof Mainberger Stuttgart 24.01.2006 Motivation Wozu Lucene? Herkömmliche Suchtechnik mittels

Mehr

OpenCms jbpm Workflow Engine. OpenCms und jbpm Workflow Engine

OpenCms jbpm Workflow Engine. OpenCms und jbpm Workflow Engine OpenCms und jbpm Workflow Engine Geschäftliche Abläufe in einem Unternehmen folgen zu einem großen Prozentsatz beschreibbaren Prozessen, den so genannten Geschäftsprozessen. Diese Erkenntnis führte zum

Mehr

Open Source CMS Lösungen

Open Source CMS Lösungen Open Source CMS Lösungen 2. Sept 2015 Patrick Aubert de la Rüe Head of CMS 1 16 Jahre Erfahrung Gegründet 1999 Spezialisierung auf Open Source Erste und grösste Schweizer TYPO3 Agentur Standorte Zürich,

Mehr

Marketinginformationen Tipps für Suchmaschinenmarketing

Marketinginformationen Tipps für Suchmaschinenmarketing Marketinginformationen Tipps für Suchmaschinenmarketing Inhalt 1 Vorbemerkung 3 2 Tipp 1 - Keywords 4 3 Tipp 2 - Linkpopularität ist wichtig 5 4 Tipp 3 - Content is King 6 5 Tipp 4 - Sponsored-Links 7

Mehr

Google findet Teilen gut? Eine empirische Studie zum Einfluss von Facebook- Shares und Co. auf das organische Ranking von Suchmaschinen

Google findet Teilen gut? Eine empirische Studie zum Einfluss von Facebook- Shares und Co. auf das organische Ranking von Suchmaschinen Google findet Teilen gut? Eine empirische Studie zum Einfluss von Facebook- Shares und Co. auf das organische Ranking von Suchmaschinen Christin Hildebrandt / Christina Schumann / Jens Wolling Agenda Einführung

Mehr