Suchindex-basierte Applikationen als Zugriffstechnologie für heterogene Informationsbestände Uwe Crenze Vorlesung Softwareentwicklung in der



Ähnliche Dokumente
Suchindex-basierte Applikationen als Zugriffstechnologie für heterogene Informationsbestände Uwe Crenze, interface projects GmbH Vortrag

intergator - Intelligente Suche in archivierten und anderen Daten

Das Informations-Cockpit für die Geschäftsführung Fileserver, Exchange, ERP, Sharepoint und mehr

Jubiläumsabo März / April 2012 Jubiläumsausgabe #1-12 Deutschland Euro 12,00 ISSN:

Suchen allein ist nicht genug!

disy Cadenza in der LDB

Best Practice: Integration von RedDot mit Livelink DM im Intranet/Extranet

EFFEKTIVE TEAM-UND PROJEKTARBEIT MIT

Mister Wong Eine Community schafft eine Ergänzung zu klassischen Suchmaschinen

Vorstellung: intergator Juni 2016

IBM Connections 4.0 Neuerungen

MEHRWERK. Einheitliche Kundenkommunikation

VTC CRM Private Cloud

CRM der nächsten Generation

SemTalk Services Stand: Februar 2015

System Center Essentials 2010

Maßgeschneiderte Suchmaschinen

Corporate Smart Process Content. Wissensmanagement mittels Prozesskontext

Business-Produkte von HCM. VDoc FileCenter. Die Lösung für Ihre zentrale Dokumentenablage

CENIT Beschwerdemanagement Beschwerden bearbeiten, analysieren und vermeiden. Stefan Jamin, Leiter ECM Zürich,

Microsoft SharePoint. share it, do it!

Elektronische Langzeitarchivierung - Kein Thema für kleine und mittlere Unternehmen, oder doch?

SharePoint und IBM FileNet P8 Integration im Handel. Fred Rothert Teamleiter DMS REWE-Informations-Systeme GmbH

GIN WEAVER. Kontextsensitive Bereitstellung von Informationen: Relevante Inhalte zur richtigen Zeit

Microsoft Dynamics CRM Perfekte Integration mit Outlook und Office. weburi.com CRM Experten seit über 10 Jahren

JustConnect. Social Enterprise 2.0 Ein sozialer Bildungsträger implementiert ein soziales Netzwerk zur internen Unternehmenskommunikation

Domis Dokumenten Management & Archiv Lösung Ihr Mehrwert

1Ralph Schock RM NEO REPORTING

Erfolgreich suchen im Internet

Dokumentenmanagement als Dienst (DMS as a Service, DaaS)

INFORMATION LIFECYCLE AKTUELLE TRENDS IM INPUT MANAGEMENT CENIT EIM IT-TAG 13. JUNI 2013 IN STUTTGART LARS LAMPE

Kick-Start: Artaker SharePoint Solutions. DI(FH) Chris Holubarz Teamlead SharePoint

IRIS. Reporting-Plattform. Autor MD Software & Design Professionelles Berichtswesen in Unternehmen

_Beratung _Technologie _Outsourcing

Elisabeth Stettler. Business Consultant. Andreas Gerig. Consultant/Projekt Manager.

Was ist Analyse? Hannover, CeBIT 2014 Patrick Keller

Planung auf Aufbau von SharePoint-Suchinfrastrukturen

Die virtuelle Forschungsumgebung WissKI Museumsdokumentation im Semantic Web. Georg Hohmann Germanisches Nationalmuseum

Die neue Generation des -Managements. Von EASY xbase zu EASY for EXCHANGE und EASY for OFFICE

Software Lösungen von masventa

Microsoft Office SharePoint Server 2007 Überblick. Gernot Kühn Partner Technical Specialist Microsoft Deutschland Gmbh

Search-Driven Applications. Florian Hopf, freiberuflicher Softwareentwickler Tobias Kraft, exensio GmbH

Business-Produkte von HCM. VDoc Report BIRT. Standardmäßig in VDoc Process enthalten. Ihr Business Intelligence und Reporting Tool

Social Workplace. Die Zukunft des Intranets. München, April 2012

IT works unlimited GmbH & Co. KG

Your time, our technologies. Talent management. Gewinnen Sie einfach Ihre Talente

Erfolgreiches mobiles Arbeiten. Markus Meys

IT IS ,- US-$. 50 IT IS

AS/point, Ihr Partner die nächsten 10 und mehr Jahre -

Unternehmensprozesse Optimieren Wissen ist Macht Daten und Informationen Professionell Managen

Nutzen und Vorteile des Prozessmanagements mit ECM

EIM- da kommen wir gerade her!

Microsoft Office Sharepoint 2010

Content Management Systeme (CMS)

SharePoint 2016 Training Aus und Weiterbildungen Dienstleistungen

Was ist neu in Sage CRM 6.1

eevolution DMS Dokumenten Management & Office Produktivität Dipl. Ing. Jens Hampl

Potential für integrierte E-Government Lösungen GIS / CMS / Portal - an praktischen Beispielen

ECM - ein Erfordernis aus technischer Sicht

Sugar innovatives und flexibles CRM. weburi.com CRM Experten seit über 15 Jahren

Technische Aspekte einer Videosuchmaschine. Björn Wilmsmann, CEO - MetaSieve GmbH

Enterprise Social Media in der Automobilbranche

esearch one-single-point-of-information Federated Search Modul

Case Study Bechtle AG. Javier Salas. Geschäftsführer

bat-groupware GmbH World of Collaboration

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria

Michael Greth. Microsoft Most Valuable Professional MVP.

Jetzt kostenfreien. T-Systems Multimedia Solutions ENTERPRISE SEARCH MIT DER GOOGLE SEARCH APPLIANCE

ShareFile Jörg Vosse

windream für Microsoft Office SharePoint Server

mobile Dokumente, Informationen, ECM... Immer präsent auch unterwegs.

esearch one-single-point-of-information Federated Search Modul

Anleitung zur Benutzung des jobup.ch Stellensuchendekontos

Weltweit mobiler Zugriff auf zentrale Unternehmensdaten

in HiDA 4.2 Die neuen Funktionen Dr. Johanna Gummlich-Wagner, HiDA-Produktmanagement startext GmbH, Bonn

Content-Management- Systeme (CMS) Inhaltsverwaltungssystem, Redaktionssystem

Best Practice Infor PM 10 auf Infor Blending

SSL PREMIUM SSL PREMIUM. Bern, 2. Juli 2015

HP Software Patch- und Version-Notification

Dr. Klaus Körmeier BlueBridge Technologies AG

SUCHEN UND FINDEN MIT SHAREPOINT

Customer Relationship Management

TeamSphere. Die Geo-Wissensdatenbank. Entwickelt von

Nutzungsmöglichkeit des Daten-Web in einer ecommerce-lösung 6. SNML-Talk,

Herzlich Willkommen. Der Weg zur eigenen Homepage. vorgestellt von Frank Kullmann

Nur Einsatz bringt Umsatz Wir stellen vor: SAP Cloud for Customer

Installation & Konfiguration AddOn CopyObjects

Intranet/Extranet: Zentrales CMS oder Portal-Lösung

Finance & Banking. Competence Center Finance & Banking. IT-Know-how. IT-Dienstleistungen. IT-Personal.

Wie Web 2.0 und Suche zusammenwachsen. Prof. Dr. Dirk Lewandowski

TEUTODATA. Managed IT-Services. Beratung Lösungen Technologien Dienstleistungen. Ein IT- Systemhaus. stellt sich vor!

MIRAKEL Informationen managen

Informations- und Kommunikationsprozesse in Unternehmen richtig strukturieren mit Wikis

!!!!T!!! Systems!() Multimedia Solutions

Der schnelle Weg zu Ihrer eigenen App

Web Content Management

T-Systems Multimedia Solutions

Dokumenten Management System sorgt für Ordnung im Weisungswesen

Dokumenten- und Informationsmanagement ganzheitlich gelöst! eevolution & Microsoft SharePoint mit ACTIWARE: Live!

Administrator Handbuch

Transkript:

Suchindex-basierte Applikationen als Zugriffstechnologie für heterogene Informationsbestände Uwe Crenze Vorlesung Softwareentwicklung in der industriellen Praxis 15.10.2012

Agenda Über interface projects & inter:gator Herausforderung Informationsmanagement Lösungsstrategien & Funktionen Projektbeispiele

Unternehmen 1993 in Dresden gegründet GmbH mit über 40 fest angestellte Mitarbeiter Ein Unternehmen der Branche / Geschäftsfelder Enterprise Search Suche-basierende Anwendungen Wissensmanagement Produkt (seit 2003) Berlin Dresden über 130 Installationen (Stand Mai. 2012) Qualitätsmanagementsystem nach DIN EN ISO 9001:2008

Informationen erstellen, sammeln, verwalten, wiederfinden & entsorgen HERAUSFORDERUNG INFORMATIONSMANAGEMENT

ECM Cloud Big Data BI/DWH Intranet Informationsmanagement NoSQL E-Discovery

Peter Drucker 11. November 2005

DIE ANTWORT IST NICHT 42

ENTERPRISE 2.0

TWITTER? FACEBOOK? XING?

SHAREPOINT!

ENTERPRISE CONTENT MANAGEMENT

IBM: Suchen ist produktiver als ordnen.

SOCIAL & SEMANTIC ENTERPRISE SEARCH

Das Erste Informationen Selektieren

DPA Informationen Verteilen

Informationen Wiederauffinden Informationen Sammeln / Bündeln Ordnen / Kanalisieren Filtern Personalisierter Informationszugriff Dateien E-Mails Wikis Klassifikation Zugriff auf benötigte Informationen

DataWareHouse vs. Ontologie Reasoning? ETL?? Ontologien http://suchanek.name/work/publications/ontology.png Suchmaschine Content http://blog.pucp.edu.pe/media/114/20070927-datawarehouse-thumb.jpg 80% unstrukturierte Daten keine Begriffssysteme

CONTENT IS THE KING!

KONTEXT RELEVANZ KONSISTENZ >>> SEMANTISCHE ANALYSE

Auffindbarkeit verbessern Automatische Verschlagwortung Kategorisierung Clustering Kontext-Navigation (Taxonomien) Agiler Informationszugriff Ein zentraler Zugriffspunkt Flexible Nutzeroberfläche Mobil verfügbar Suche-basierte Lösungen Personalisierte Informationsströme Suchen überflüssig machen Personen-, Gruppen- und Kontext-bezogene Filter (Facetten) Zugriffsrechte Inhalte semantisch aggregieren Wissensdatenbank Wissensnetz Semantische Relationen Konsolidierte Sichten Skill-Profile Schneller Wiederauffinden Systemübergreifende, Index-basierte Suche Suchvorschläge Sucherweiterung (Thesaurus) Semantic Information Access Unterstützung von Compliance Anforderungen Überprüfung von Ablagestrukturen Dubletten-Prüfung Überprüfung von Referenzen

70% SUCHE 20% DMS 10% KOLLABORATION

Suche-basierter Informationszugriff HERAUSFORDERUNGEN BEIM SUCHEN & FINDEN

violator3@flickr

http://pixdaus.com/single.php?id=100774

Suche in Fachdaten Alle Informationen zum Thema XYZ: Vorschriften Aktuelles Ansprechpartner Leistungen Hohe Anforderungen an die Suchkompetenz der Nutzer http://www.recipeapart.com/wp-content/uploads/2008/03/funny-board-google.jpg Hohe Datenqualität Produktive Benutzer-Oberfläche Adäquates Suchverhalten

Strukturierte & unstrukturierte Informationen DMS Datenbanken ERP Zuordnung über gemeinsame Kriterien Anzeige von Veritas (jetzt Symantec) Mehrere Ordnungskriterien Datei-Server? E-Mail? Web-Server?

Web-Sites CRM Dateiserver 1. abc 2. def 3. qrt 4. xyz ECM Enterprise Search Datenbanken Microsoft Sharepoint ERP

Wichtige Quell-Systeme Sieber & Partners, 2009

Anbieter & Akquisitionen 2008 FAST Search & Transfer -> Microsoft 2011 Autonomy -> Hewlett Packard (10 Mrd. $) 2011 Endeca -> Oracle 2012 ISYS -> Lexmark ECM-Hersteller integrieren ES-Lösungen OpenSource Lösungen basierend auf Apache Lucene Viele kommerzielle Lösungen auf der Basis von Apache Lucene (inkl. IBM OmniFind)

inter:gator Enterprise Search PRODUKTPHILOSOPHIE

Suchergebnis über Filter einschränken systematische Recherche anhand von Metadaten System-übergreifender Index personalisierte Informationskanäle Pinnwand / Cockpit / Portal Dateisystem Datenbank Website E-Mail

Neuartige personalisierte Suchperspektive Einfache Navigation durch tief hierarchische Datenbestände Einheitliche Sicht über die Datenbestände

Persönliche Pinnwand Aktuelle Nachrichten Lesezeichen Gespeicherte Suchen Eigene Dokumente

Motivation für ein Nicht-Portal DAS DASHBOARD

Motivation Dashboard Das Sucheingabefeld benötigt eine Heimat Bündelung von verschiedenen Informationskanälen Personalisiertes Recherche Front-End Häufig benötigte Suchen Aktuelles

T-Systems MMS Social Intranet +Social Search?

MMS (un-soziale) Suche Datenquellen TeamWeb Sharepoint MyMMS Phonebook

Portal - Information Cockpit Datenquellen TeamWeb Sharepoint MyMMS Phonebook

Wissensnetz Aggregiertes Skill-Profil Datenquellen TeamWeb Sharepoint MyMMS Phonebook

Social Search als weiteres Produkt? Datenquellen TeamWeb Sharepoint MyMMS Phonebook

SemVIS Datenquellen TeamWeb Sharepoint MyMMS Phonebook

T-Systems MMS - Social Intranet (Search-based)

Für Unterwegs Jederzeit + Überall + Informiert Einfache Anwendungsoberfläche Vorschau auf Dokument- und Metadaten Vorschau auch für Anlagen von E-Mails Navigation über verknüpfte Informationsobjekte Wahrung aller Zugriffsrechte Keine Installation von Drittanwendungen Verfügbar für BlackBerry, iphone und Android Smartphones

inter:gator Enterprise Search AUSGEWÄHLTE FUNKTIONEN

Appliance vs. Virtualisierung vs. NoSQL Optimale Systemkonfiguration für eine leistungsfähige Suchlösung Support aus einer Hand für die Gesamtlösung (Soft- und Hardware) Schnelle Integration in die vorhandene IT-Infrastruktur Geringste Komplexität bei hohen Anforderungen Lizenzen von 500.000 bis 50 Mio. Index-Objekte pro System

Such-Vorschläge Such-Erweiterung Such-Einschränkung

Keymatches

Treffer als Favorit speichern: Lesezeichen, Schlagwörter, Kommentar

Gespeicherte Suchen

Trefferdarstellung (Templates)

Wissensnetz (Explorative Suche)

Recherche in umfangreichen Dokumentationen Einzelne Seiten als Suchtreffer statt ganzer Dateien Suchtreffer ohne native Anwendung bewertbar Automatische Verlinkung zwischen Dokumenten Kein ActiveX, Flash oder Java

Administration Zentral + Sicher + Einfach Web-basierend umfassende Konfiguration der Datenquellen Nutzer und Rollen Verwaltung Zeitplanung der Indexierung zusätzlich: Kommandozeileninterface (CLI)

Grundlage für die Optimierung der unternehmensinternen Suche Erhöhung der Datenqualität durch Dubletten-Erkennung hohe Zeitersparnis bei Auswertungen umfangreiche Statistikfunktionen vielseitige Exportmöglichkeiten (XML, PDF und Excel ) Suchstatistiken Nutzungsstatistiken Inventory-Reports Klick-Statistik Administrative Reports Fehler-Report (error log)

Kalibrierung / Optimierung Sucherweiterung durch Synonyme (kontrolliertes Vokabular) Datenbanktabellen Aktenpläne Thesauri (wichtige Begriffe und Synonyme) Einschränkung des Suchergebnisses anhand von Metadaten (Facetten) Ranking vs. Sortierung vs. Gruppierung von Treffern vs. Keymatches Automatische Verschlagwortung durch Textanalyse (insbesondere für Filter) Annotationen durch Benutzer (Ergänzungen, Schlagwörter, Favoriten) Gewichtung der Treffer (Ranking)

Ranking Inhalt Metadaten Aktualität Kategorien Nutzerprofil Nutzer-Aktion 3 Matches im Text besser als 2 Treffer im Titel wichtiger als Treffer im Text Priorisierung von Quellen Neues wichtiger als Altes Verträge wichtiger als E-Mails Vertrieb Entwicklung Bewertung Anzahl der Zugriffe

Content Processing Format Conversion Language Detection Synonyms Spell Checking Lemmas (tenses, forms) Document Taxonomy Classification Vectorizer Custom PLUG-IN Entities Geography Companies People Scopifier index PARIS (Reuters) - Venus Williams raced into the second round of the $11.25 million French Open Monday, brushing aside Bianka Lamade, 6-3, 6-3, in 65 minutes. Input: byte stream Output: structured document ready to be indexed The Wimbledon and U.S. Open champion, seeded second, breezed past the German on a blustery center court to become the first seed to advance at Roland Garros. "I love being here, I love the French Open and more than anything I'd love to do well here," the American said.

Verschlagwortung & Klassifikation unstrukturierter Text Verzeichnisstrukturen & Bezeichner Dokumentstruktur Inhalte Algorithmen: Linguistik Wahrscheinlichkeit Statistik Wörterbücher Extraktion Automatische Verschlagwortung Fachwissen: Fachwörterbücher Geschäftsregeln Ontologien Qualifizierte Informationen Eigennamen Themen/Phrasen Kategorien Aktenzeichen Benutzerinteraktion: Suchanfragen Trefferauswahl Annotationen

inter:gator SDK Indexierung & Suche Suche Dashboard CLI ITL OpenSearch Zugriffsschutz Suchdienste Suche Facetten Vorschau Templates Procedures Reporting Zugriffsrechte Index Volltext Vorschaubilder Metadaten Search-Log Text Metadaten Vorschaubild Verarbeitung der Dokumente Informationsbeziehunen Textanalyse Verschlagwortung Klassifizierung Attachments Zugriff auf Datenquellen Dateisystem Datenbank SharePoint WWW E-Mails u.v.m.

Verfügbarkeit & Skalierung Standort A Standort B Standort A Standort B Suche Suche Suche Suche Index A Index B Index B Index A Index A Index B Indexer Indexer Indexer Indexer Datenquellen A Datenquellen B Datenquellen A Datenquellen B Multi-Index-Search Index-Replikation

inter:gator Enterprise Search PROJEKTBEISPIELE

IT S ALL ABOUT PEOPLE!

Best Practices 1. Search Assessment (Erstellung Fachkonzept) 2. Proof of Concept mit ausgewählten Inhaltsquellen & Stakeholdern 3. Umsetzung Feedback & Produktivsetzung 4. Einbindung weiterer Inhaltsquellen 5. Auswertung Search Log & Tuning Geschäftsprozesse Enterprise Search

Die goldenen Regeln Datenqualität Gültige Inhalte ( Ausmisten ) Richtige Metadaten (aktualisieren kopierter Vorlagen) Adäquate Ablagestrukturen (kein Eimer ) Informationsschema Kategorien für Informationsarten (Dokumenttypen etc.) Indikatoren für Beziehungen zwischen Dokumenten (Aktenzeichen, Projektnummern etc.) Normalisierung von Begriffen Stemming & Grundformreduktion Synonyme, Akronyme etc. (Thesaurus, Aktenplan etc.) Suchvorschläge vs. Erweiterte Suche (Formular) Facetten vs. Ranking vs. Keymatches Personalisierung Such-Profile (Vertrieb, Entwicklung, ) Gespeicherte Suchen Pinnwand Suchstatistik auswerten!

inter:gator Suchlösungen Enterprise Search für den Mittelstand Intranet-Suche Unterstützung von Geschäftsprozessen Recherchelösungen für Datenbanken Suchlösungen für Microsoft Sharepoint Wissensmanagement Suchlösungen für Web-Sites und ecommerce

Stadtverwaltung Chemnitz Intranet - Startseite

Stadtverwaltung Chemnitz Redaktionssystem: Webseiten interne Mitteilungen Dokumente (PDF, ) Dienstleistungen ergänzende Daten Korrekturdaten Objektfotos inter:gator (Index) Ratsinformationssystem: Termine (Sitzungen, ) Verzeichnisdienst: OrgStruktur (Ämter, ) Kontaktdaten Fachanwendungen: Städtische Betriebe Städtische Einrichtungen Gebäudemanagement Geo-Koordinaten

Kühn + Nagel Corporate Intranet Search

Personalwirtschaft (Management Angels GmbH)

Portal Zahnärzte in Sachsen Virtuelles Archiv & Ordnungsstrukturen durch Indizierung

Skill-Management Strukturierte Daten Neueste Infos aus Sharepoint Wiki-Beiträgen Kommentaren Status Kontaktdaten Themenwolke (aggregiertes Skill- Profil)

Web-Site Suche & ecommerce

Sie werden Suchen besser Finden! Dr. Uwe Crenze +49 (0)3 51 3 18 09 12 uwe.crenze@interface-projects.de www.xing.com/profile/uwe_crenze