Wer sucht der findet... Das Suchen in der Zukunft Prof. Abraham Bernstein, PhD Universität Zürich Institut für Informatik 1 Suchen in der Zukunft Prediction is very difficult, especially about the future. Niels Bohr The best way to predict the future is to invent it. Alan Kay I think there is a world market for maybe five computers. allegedly by T. J. Watson 2
Suchen in der Zukunft P (A E) = P (E A)P (A) P (E) 3 Die soziale Suche 4
Die soziale Suche... beruht auf auf dem Wissen und Empfehlungen von Anderen 5 Aber kann man den sozialen Informationen vertrauen? Did the 1999 Rambouillet Accords allow NATO to operate in all of Yugoslavia or only in Kosovo? 70% 53% 35% 18% 0% State Department 2 Quellen Falsch Anti-NATO Richtig Mehere Quellen Graham & Metaxas, 2003 6
Kommerzielle vs. Communitybasierte Informationen Prestipino 2008 / Prestipino, Aschoff, Schwabe 2006 7 Kommerzielle vs. Communitybasierte Informationen 4.75 # Nachrichten / Monat 4.5 4.25 4 3.75 3.5 gedruckter Reiseführer Brasilien Virtual Tourist Brasil 461 rec.travel.australia+nz 370 Thorn Tree Forum (UK) 5238 alt.travel.greece 96 rec.travel.usa-canada 1821 virtuelle Gemeinschaft Australien Grossbritanien Griechenland USA Prestipino 2008 / Prestipino, Aschoff, Schwabe 2006 8
Semantische Ambiguitäten mentale Repräsentation r e i e kr Symbol (z.b. Java ) t? bezieht sich auf Objekt realer Gegenstand Richards 1960 9 Semantische Ambiguitäten Spielen mach Spass gilt nicht als Arbeit Semantische disambiguierung als Nebenprodukt von Ahn (2006) IEEE Computer Magazine 10
Die soziale Suche + Bei bestimmten Inhalten fällt es Menschen leichter als Maschinen diese zu kategorisieren und zu bewerten (Fotos, Videos, Musik) + Das gemeinsame Suchen von Inhalten hat eine soziale Komponente + Möglicherweise höhere Relevanzwerte und weniger Spam (Offene Forschungsfrage) - Es entsteht Aufwand für menschliche Nutzer - Die Verlässlichkeit des Ansatzes hängt stark von der Community bzw. dem sozialen Netzwerk ab - Das Vocabulary Problem (Semantische Ambiguitäten) 11 Suchen in der Zukunft P (A E) = P (E A)P (A) P (E) 12
http://www.ifi.uzh.ch/katharinareinecke http://www.ifi.uzh.ch/abraham_bernstein http://www.ifi.uzh.ch/ai http://www.ifi.uzh.ch/cumo http://www.ifi.uzh.ch/seminar http://www.ifi.uzh.ch/required http://www.ifi.uzh.ch/irchel As of July 2009 LinkedCT Reactome Taxonomy KEGG PubMed GeneID Pfam UniProt OMIM PDB Symbol ChEBI Daily Med Diseasome CAS HGNC Inter Pro Drug Bank UniParc UniRef ProDom PROSITE Gene Ontology Homolo Gene Pub Chem MGI UniSTS GEO Species Jamendo Programmes Musicbrainz Magnatune Later + TOTP Surge Radio MySpace Wrapper Audio- Scrobbler Linked MDB John Peel Playcount Data Gov- Track US Census Data riese Geonames lingvoj World Factbook Eurostat flickr wrappr Open Calais Revyu SIOC Sites Doapspace Flickr exporter FOAF profiles Crunch Base Sem- Web- Central Open- Guides Wikicompany QDOS Pub Guide RDF ohloh W3C WordNet Open Cyc UMBEL Yago DBpedia Freebase Virtuoso Sponger DBLP Hannover IRIT Toulouse SW Conference Corpus RDF Book Mashup Project Gutenberg DBLP Berlin LAAS- CNRS Budapest BME IEEE IBM Resex Pisa Newcastle RAE 2001 CiteSeer ACM DBLP RKB Explorer eprints LIBRIS Semantic Web.org Eurécom RKB ECS Southampton CORDIS ReSIST Project Wiki National Science Foundation ECS Southampton Linked GeoData Music As of July 2009 LinkedCT Reactome Taxonomy KEGG PubMed GeneID Pfam UniProt OMIM PDB Symbol ChEBI Daily Med Diseasome CAS HGNC Inter Pro Drug Bank UniParc UniRef ProDom PROSITE Gene Ontology Homolo Gene Pub Chem MGI UniSTS GEO Species Jamendo Programmes Musicbrainz Magnatune Later + TOTP Surge Radio MySpace Wrapper Audio- Scrobbler Linked MDB John Peel Playcount Data Gov- Track US Census Data riese Geonames lingvoj World Factbook Eurostat flickr wrappr Open Calais Revyu SIOC Sites Doapspace Flickr exporter FOAF profiles Crunch Base Sem- Web- Central Open- Guides Wikicompany QDOS Pub Guide RDF ohloh W3C WordNet Open Cyc UMBEL Yago DBpedia Freebase Virtuoso Sponger DBLP Hannover IRIT Toulouse SW Conference Corpus RDF Book Mashup Project Gutenberg DBLP Berlin LAAS- CNRS Budapest BME IEEE IBM Resex Pisa Newcastle RAE 2001 CiteSeer ACM DBLP RKB Explorer eprints LIBRIS Semantic Web.org Eurécom RKB ECS Southampton CORDIS ReSIST Project Wiki National Science Foundation ECS Southampton Linked GeoData Music 13 14
Struktur erlaubt: Nahtlose Verwendung von verteilten Informationsquellen Disambiguierung von Begriffen Verarbeiten von Widersprüchen Neuartige Interaktionen 15 Struktur erlaubt: Nahtlose Verwendung von verteilten Informationsquellen Disambiguierung von Begriffen Verarbeiten von Widersprüchen Neuartige Interaktionen 16
Struktur erlaubt: Nahtlose Verwendung von verteilten Informationsquellen Disambiguierung von Begriffen Verarbeiten von Widersprüchen Neuartige Interaktionen Aufbau von Trust & Policy Regeln 17 Semantic Web: Trust & Policy Benutzerinteraktion Trust & Policies Beweise OWL / Rules (Vokabulare) RDF / XML (typisierte Grafen/Netze) Kryptographie URI/URL Unicode Tim Berners-Lee 18
Suchen in der Zukunft P (E A)P (A) P (A E) = P (E) 19 Bayes sche Regel P (A Evidenz) = = P (Evidenz A)P (A) P (Evidenz) αp (Evidenz A)P (A) P (Antwort Suchanfrage) = αp (Suchanfrage Antwort)P (Antwort) P (Bedeutung Kontext) = αp (Kontext Bedeutung)P (Kontext) P (GuteInfo Forum) = αp (Forum GuteInfo)P (Forum) P (FilmGut Beziehungen) = αp (Beziehungen FilmGut)P (Beziehungen) 20
Suchen in der Zukunft P (E A)P (A) P (A E) = P (E) 21 Lokalisation von Suchmaschinen und deren Marktanteile Search-Engine Marktanteile in Südkorea [NY Times, 2007]: Naver.com: 77% Daum.net: 10.8% Yahoo: 4.4% Google: 1.7% 22
UIs Switzerland South Korea China Japan 23 OMORE Privacy-aware Collaborative Filtering 24
Zusammenfassung Die Suche der Zukunft Semantic Web: Trust & Policy Benutzerinteraktion Trust & Policies Beweise OWL / Rules (Vokabulare) P (E A)P (A) P (A E) = P (E) RDF / XML (typisierte Grafen/Netze) URI/URL Kryptographie Unicode Tim Berners-Lee OMORE UIs China South Korea Privacy-aware Collaborative Filtering Switzerland Japan 25