Information Retrieval Einführung Kursfolien Karin Haenelt 22.7.2015
Themen Traditionelles Konzept / Erweitertes Konzept Auffinden von Dokumenten Rankingfunktionen Auffinden und Aufbereiten von Information 2
Information Retrieval Traditionelles Konzept Auffinden von Dokumenten, die für eine Suchanfrage relevant sind Ranking der Dokumente Erweitertes Konzept Auffinden von Information, die für eine Suchanfrage relevant ist Nutzung von Methoden der Bereiche Text Mining Frage-Beantwortung 3
Information Retrieval Klassische Architektur Auffinden von Dokumenten: Grundkonzept Dokumente D 1 Analyse Repräsentation (Index) - Matching - Ranking Dokumente D 2 Anfrage Analyse Repräsentation D 2 D 1 4
Information Retrieval Rankingfunktionen inhaltsbasiert: Ähnlichkeitsberechnungen zwischen Anfragetermen und Dokumentvektoren Boolesches Modell: Mengenoperationen Vektormodell: Ähnlichkeitsbegriffe für Vektoren: Vektoroperationen der linearen Algebra Probabilistisches Modell: Wahrscheinlichkeitsrechnung, Bayes- Theoreme hyperlinkbasiert(hits, PageRank) profilbasiert (Standort, Cookies, Soziale Netzwerke, Klickverhalten, ) 5
Information Retrieval Google Architektur (2014) Auffinden von Dokumenten und Information D.F. Huynh, G. Li, C. Ding, Y. Huang, Y. Chai, L. Hu, J. Chen (2014, Abb. 1) 6
Information Retrieval Auffinden von Information durch Sprachverarbeitungsmethoden Faktenextraktion Clustering Semantic Web, Semantische Agenten Frage-Beantwortung Textzusammenfassung durch Graph Mining auf Wissensbasen 7
Auffinden von Information Beispiel: Faktenaufbereitung https://www.google.de/#q=kastanie, 19.10.2013 8
Auffinden von Information Beispiel: Faktenaufbereitung / Standortabhängigkeit https://www.google.de/#q=wetter 18.10.2013 9
Auffinden von Information Beispiel: Standortabhängigkeit aufgerufen mit IP aus Stuttgart https://www.google.de/#q=auto 19.10.2013 10
Auffinden von Information Beispiel: Lesartendifferenzierung https://www.google.de/#q=jaguar 19.10.2013 11
Auffinden von Information Beispiel: Sprachübergreifende Suche https://www.google.de/#q=mediawiki+hintergrundbild, 23.8.2013 12
Strategien der Inhaltserschließung vollautomatische Massendatenverarbeitung manuelle Annotation individuell, partiell kollaborativ, Massen 13
Strategien der Inhaltserschließung Beispiele: Kollektive Kollaboration http://www.flickr.com/photos/tags/apple/clusters/ 19.10.2013 https://www.google.de/#q=kastanie, 19.10.2013 14
Literatur D.F. Huynh, G. Li, C. Ding, Y. Huang, Y. Chai, L. Hu, J. Chen (2014). Generating insightful connections between graph entities. Patent US 20140280044 A1. http://www.google.com/patents/us20140280044 15
Copyright 2001-2015 Karin Haenelt All rights reserved. No part of these slides may be reproduced in any form by any electronic or nonelectronic means (including photocopying, recording, or information storage and retrieval) without permission in writing from the author. Bibliographic data. Karin Haenelt, Information Retrieval. Einführung. Kursfolien. 22.7.2015 + URL Please quote correctly. If you use the presentation or parts of it for educational and scientific purposes, please observe the laws (copyright, Urheberrecht, etc.). Please include the bibliographic data (author, title, date, page, URL) in your publication (book, paper, course slides, etc.). For commercial use: No commercial use is allowed without written permission from the author. In case you are interested in commercial use please contact the author. Versionen - 22.7.2015, 19.10.2013, 21.10.2012 16