neofonie DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR



Ähnliche Dokumente
Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Suchergebnisdarstellung in Google, Bing, Cuil, etc. Christina Ficsor

Die Entwicklung eines Glossars (oder eines kontrollierten Vokabulars) für ein Unternehmen geht üblicherweise in 3 Schritten vor sich:

Workshop Was nicht passt, wird passend gemacht? tekom, Frühjahrstagung 2014 Augsburg, icms GmbH

Consulting. Dokumentenmanagement. Stand: jwconsulting GmbH Caspar-David-Friedrichstr Walldorf

RMeasy das SAP IS U Add On für Versorgungsunternehmen. Optimieren Sie Ihre Prozesse in Kundengewinnung und Kundenbindung.

Wordpress: Blogbeiträge richtig löschen, archivieren und weiterleiten

Gezielt über Folien hinweg springen

Erfahrungen mit Hartz IV- Empfängern

Informationssystemanalyse Problemstellung 2 1. Trotz aller Methoden, Techniken usw. zeigen Untersuchungen sehr negative Ergebnisse:

Integration verteilter Datenquellen in GIS-Datenbanken

David Mika. Donnerstag, den 15. März Verein zur Förderung der privaten Internet Nutzung e.v. Suchen und Finden im Internet.

Einführung Architektur - Prinzipien. Ronald Winnemöller Arbeitsgruppe VCB Regionales Rechenzentrum Universität Hamburg

Auswertung Kundenbefragung Essen auf Räder

Die neue bunte Google-Suche

Warum Suche (trotzdem) bedeutend ist

Corporate Websites MEHRSPRACHIGE MULTICHANNEL-PROJEKTE MIT WORKFLOWS. 18. und 19. September DMEXCO Michael Steinfort, comspace.

Warum Sie jetzt kein Onlinemarketing brauchen! Ab wann ist Onlinemarketing. So finden Sie heraus, wann Ihre Website bereit ist optimiert zu werden

Social Media. Live Beispiel

facebook wie geht das eigentlich? Und was ist überhaupt Social media?

TYPO3 Slide Lightwerk GmbH

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin:

FRAGEBOGEN ANWENDUNG DES ECOPROWINE SELBSTBEWERTUNG-TOOLS

Kofax TotalAgility 7 WEGBEREITER. Eine kurze Anleitung für diejenigen, die mit Kunden arbeiten! für

Erstellung von Reports mit Anwender-Dokumentation und System-Dokumentation in der ArtemiS SUITE (ab Version 5.0)

Wie Web 2.0 und Suche zusammenwachsen. Prof. Dr. Dirk Lewandowski

Protect 7 Anti-Malware Service. Dokumentation

So versprüht man digitalen Lockstoff

Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers

Zwischenablage (Bilder, Texte,...)

Eine semantische Suchmaschine in der Biomedizin

Online-Werbung. Welche Möglichkeiten der Online-Annoncen gibt es? Google AdWords und Co.

HMC WEB INDEX. Erste große Deutschland Studie. Wie fit sind die Clubs im online marketing?

Produktvorstellung: CMS System / dynamische Webseiten. 1. Vorwort

Professionelle Seminare im Bereich MS-Office

Kapitel 4 Die Datenbank Kuchenbestellung Seite 1

2006, Falk Neubert (ecoservice / materialboerse.de GmbH)

Pressemitteilung. Sichere Dokumente in der Cloud - Neue Open Source Dokumenten-Verschlüsselung

Volltextsuche im Service Desk

Gambio GX2 FAQ. Inhaltsverzeichnis

Fragebogen. zur Erschließung und Sicherung von Online-Dokumenten. Auswahl von elektronischen Publikationen

Lokale Installation von DotNetNuke 4 ohne IIS

Themenschwerpunkt Social SEO

2.1 An welchen Weiterbildungsmaßnahmen haben Sie bisher teilgenommen? Beurteilen Sie bitte rückblickend deren Relevanz für Ihr Tätigkeitsfeld?

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

Universitätsbibliothek. Technische Universität München. Internetsuche. Wissenswertes und Wissenschaftliches

Anleitung für die Teilnahme an den Platzvergaben "Studio II, Studio IV und Studio VI" im Studiengang Bachelor Architektur SS15

Was macht Layer2 eigentlich? Erfahren Sie hier ein wenig mehr über uns.

Was ist das Tekla Warehouse

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

HP Product Content Syndication Steigern Sie Ihre Add-to-Cart Rate in 3 einfachen Schritten

Sichere Anleitung Zertifikate / Schlüssel für Kunden der Sparkasse Germersheim-Kandel. Sichere . der

3 Personenbereich und soziale Netze

Datenbank-Recherche der nächsten Generation

Internet Explorer Version 6

Vorankündigung Die Verlagsleitung und der Erfolgsautor der Blauen Business-Reihe ist auf der Frankfurter Buchmesse 2007 vertreten.

Was bedeutet Inklusion für Geschwisterkinder? Ein Meinungsbild. Irene von Drigalski Geschäftsführerin Novartis Stiftung FamilienBande.

Advoware mit VPN Zugriff lokaler Server / PC auf externe Datenbank

egovernment für das Open Source CMS Contao

FIREBIRD BETRIEB DER SAFESCAN TA UND TA+ SOFTWARE AUF MEHR ALS EINEM COMPUTER

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

1. Einführung Erstellung einer Teillieferung Erstellung einer Teilrechnung 6

GIN WEAVER. Kontextsensitive Bereitstellung von Informationen: Relevante Inhalte zur richtigen Zeit

Schuljahreswechsel im Schul-Webportal

Ein mobiler Electronic Program Guide

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

Web-Services - die GIS-Zukunft?

Ursula Coester // Social Media Institute / Chancen für den Einsatz von Social Media im Handel

Datenabgleich. Meine Welt auf einen Blick erleben.

Mobile Applikationen für Geschäftsreisen Was brauchen die Unternehmen wirklich?

Abenteuer e-commerce Erfolgreich mit dem eigenen Onlineshop.

Verbesserungen im Internetauftritt UM. Termin bei Frau Minister Gönner am 1. Juli Umweltgoogle

D R. K E R S T I N H O F F M A N N UNTERNEHMENSKOMMUNIKATION. Prinzip kostenlos. Wissen verschenken Aufmerksamkeit steigern Kunden gewinnen

Starten sie WordPad über das Startmenü von Windows. WordPad finden Sie im Ordner Zubehör.

PDF-Druck und PDF-Versand mit repdoc Werkstattsoftware

I.O. BUSINESS. Checkliste Effektive Vorbereitung aktiver Telefonate

Softwareentwicklungspraktikum Sommersemester Grobentwurf

Stellungnahme. E-Government-Standards Seite 1 von 5. Dokumente:...eCH Version: ech-kategorie:...standard. Datum der Eingabe:

Content Marketing für webseiten

Arbeitsgruppen innerhalb der Website FINSOZ e.v.

Consulting & Software Repolusk

ISO im Überblick

> Soft.ZIV. Maple Mathematisches Software System

2 Evaluierung von Retrievalsystemen

Allgemeines zu Datenbanken

Integration, Migration und Evolution

Internet online Update (Mozilla Firefox)

B12-TOUCH VERSION 3.5

Workshop. Zeitmanagement Hamburg, 24. November 2004

AW: AW: AW: AW: Kooperationsanfrage anwalt.de

Was wir über das Internet wissen sollten. Fischen im Netz der Netze Zusammengestellt von Heinz-Arnold Schneider

Access [basics] Rechnen in Berichten. Beispieldatenbank. Datensatzweise berechnen. Berechnung im Textfeld. Reporting in Berichten Rechnen in Berichten

WAS IST IEDIT? WOZU BRAUCHE ICH IEDIT?

PDF-Druck und PDF-Versand mit PV:MANAGER

Fragebogen für eine qualitative/quantitative Befragung zur Mediencommunity 2.0 aus Sicht der Lernenden

Regalprüfer ipad App. Presseartikel

CRM-Anpassung. Passen Sie CRM On Demand perfekt an Ihre Geschäftsprozesse

Transkript:

neofonie DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR Suchportale der nächsten Generation Dr. Thomas Schwotzer Leiter Forschung, neofonie

Suche eine Folien Geschichte 1993: Beginn der HTML-Ära 1993 erste Suchmaschinen (Indexer und Webcrawler) 1994: Yahoo! 1995: InfoSeek, Altavista 1998: Fireball, erste deutsche Suchmaschine (neofonie) 1999: Google, Beta Qualitätskriterien Größe indizierte Datenbasis Recall (Verhältnis der gefundenen zu allen relevanten Dokumente der Basis) Precision (Verhältnis der relevanten zu allen Dokumente der Trefferliste) Herausforderung der HTML-Ära: Großer Index, viele und gute Treffer 2

Grenzen des Wachstums Was tun, wenn von Milliarden Dokumenten 0,1% relevant sind und mit einer Präzision von 80% gefunden werden? Hundertausende von Treffern Anforderungen an eine Suchmaschine heute: Finde den perfekten Match (personalisiert, situationsbasiert, kontextualisiert) Inhaltliche Übersicht über Themen verschaffen Mehrsprachigkeit, Umgangssprache unterstützen Immer Treffer liefern. Immer! Viele Daten, ein Suchportal (Datenintegration) Interaktion Portalbetreiber / Anwender erlauben Ära der Web 2.0 Suche: Wenige, sehr exakte Treffer 3

Der perfekte Treffer Hunger!! Hintergrundinformationen: mag kein Rind/Schwein, ist im Urlaub, 12:32, Standort Berlin X-Straße, Ecke Y 20m geradeaus, dann rechts Sushi-Laden. Viel gelobt, hat auch leckeres Bier. 4

Kontext Nutzerprofile (Hintergrundwissen, Vorlieben, etc.) Situation (Urlaub, Meeting, unterwegs,..) Mögliche Treffer Zeit Ort Mögliche Repräsentationsform: Semantische Netze 5

Klassisches Vorgehen: Ontologie/Klassifikation Kein Fleisch Urlaub Restaurant A Mittag Berlin 6

Alternativen Klassisches Vorgehen praktisch undurchführbar Manueller Aufbau Ontologie in Praxis nicht praktikabel Allgemeine Automatische Klassifikationen von beliebigen Webinhalten extrem schwer Alternative: Ontologie(n) verweisen nicht direkt auf Ergebnisse halten stattdessen Verfeinerungen der Suche Beeinflussen Ranking Notwendig für praktische Anwendungen: Ontologien (halb)automatisch erzeugen oder aus existierenden externen Systemen beziehen 7

Ansätze nicht-manueller Ontologien Erzeugung von Themenclustern anhand einer Cluster- / Co-occurrence-Analyse der Inhalte von Dokumenten Beispiel: Web.de Erweitere Suche http://suche.web.de/search/profi/?su=&mc=hp@suche.suche@home Dabei Integration von Wikipedia Geplante Erweiterungen z.b. Integration von DMOZ (http://www.dmoz.de/) 8

Vokabulare / Mehrsprachigkeit Herausforderungen: Mehrsprachigkeit Dialekte, Slang Lösungen: Integration von Wörtbüchern Spidern, z.b. von Blogs Ziele: Finden auch wenn nach Synonymen gesucht wurde Tippfehler auftraten Worte anderer Sprachen genutzt wurden (wirkliche Herausforderung beim wachsenden Denglisch als Umgangssprache!) Treffer werden gefunden, auch wenn Suchbegriff nicht gefunden 9

Architektur semantischer Suchmaschinen Externe Ontologien / Thesauri / Vokabulare Weiterer Kontext Clusteralgorithmen Datenquelle A Hunger! Ontologien Datenquelle B Datenquelle C Sushi! Index Spider Datenquelle X 10

Topic Maps (1) ISO 13250 Erste Version 1999, aktuelle Version aus dem Jahr 2005 Beinhaltet Referenz- und Datenmodell und Serialisierungsformat: XML Topic Maps (XTM) Kompakter als RDF/OWL diverse Open Source und kommerzielle Implementierungen neofonie ist deutscher Partner der Ontopia AS, Oslo weltweit führender Anbieter für Topic Map Plattformen Maßgeblicher Wegbereiter des Standards 11

Topic Maps (2) the TAO of Topic Maps Topicsteht für etwas über das Informationen gesammelt werden, z.b: Produkt Kunde Begriff Assoziationen verbinden zwei oder mehr Topics Topics spielen Rollen in Assoziationen Topics können beliebig viele Rollen spielen Occurrences verweisen auf Dokumente, z.b. mittels URLs IDs für CMS oder Datenbanken Queries Scopes schränken Gültigkeitsbereiche von Assoziationen und Occurrences ein 12

Topic Maps (3) T A Scope T T Rolle A Rolle T S 13

Topic Maps Stärken / Schwächen Stärken für unserer Zwecke Datenmodell und Serialisierungsformat verfügbar Weniger komplex als RDF-Familie Eher CMS-Austauschformat als Format für Wissensbasen Frameworks für Webanwendungen existieren, z.b. TM4J, inklusive STRUTS / Velocity Adaption Ontopia Knowledge Suite (OKS) Anfragesprache existiert als Quasi-Standard: TOLOG Schwächen Standard nicht fertig Keine Constraint Language Keine ISO Topic Map Anfragesprache 14

Was Topic Maps (nicht) leisten Sie leisten nicht: Kein neues Wissen durch Einsatz von Topic Maps Keine schöneren Webanwendungen Keine Build-in Lexika oder Wissensbasen dank Topic Maps Sie leisten: Einheitliches Format und Datenmodell Quasi-Standard-Anfragesprache (TOLOG) Ein bisschen Datamining kann betrieben werden Rege, freundliche und internationale Community Investitionssicherung im Gegensatz zu proprietären Formaten 15

Datenintegration mit Suchportalen Internetsuche selten die Regel Bsp.: Portale wie O2 Vielen Datenquellen, eine Suchportal Einheitliche Sicht auf verteilte Daten durch gemeinsamen Index (Form der) Datenintegration Kostengünstig, flexibel Portal Index Datenquelle 1 Datenquelle n 16

Suche in Peer-Netzen 17

Beispiel Suche in Peer-Netzen P2P Wissensmanagementsystem für Rechtsämter im Raum Aachen (Projekt WikoR) Verteilte Daten, die nicht integriert werden sollen Suche in allen Rechtsämtern ermöglichen Austausch und Suche auf Ontologieebene Es existiert gemeinsames Schema für alle Topic Maps Topic Map Daten 18

Fazit: Suche wird semantisch Suche nach dem perfekten Treffer Ontologien! Manuelle Erstellung von Ontologien praktisch nicht machbar (halb)automatische Verfahren zur Erzeugung von Ontologien existieren und werden z.t. bereits praktisch eingesetzt Ermöglichen Verfeinerung Indexsuche unscharfe Suche (z.b. dank Vokabularen) Verteilte Suche, auch P2P Suche gewinnt an Bedeutung neofonie setzt derzeit auf Topic Maps als Repräsentationsformat von Ontologien 19

Vielen Dank für Ihre Aufmerksamkeit Fragen!? Dr. Thomas Schwotzer Leiter Forschung, neofonie thomas.schwotzer@neofonie.de 20