Lernende Suchmaschinen



Ähnliche Dokumente
Professionelle Seminare im Bereich MS-Office

IT-Unternehmensarchitektur Übung 01: IT-Strategie

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

kleines keyword brevier Keywords sind das Salz in der Suppe des Online Marketing Gordian Hense

Gesucht und Gefunden: Die Funktionsweise einer Suchmaschine

1 Mathematische Grundlagen

Das Lastverteilungsproblem

Primzahlen und RSA-Verschlüsselung

Hilfe zur Urlaubsplanung und Zeiterfassung

Lichtbrechung an Linsen

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus:

Web-Kürzel. Krishna Tateneni Yves Arrouye Deutsche Übersetzung: Stefan Winter

Anleitung über den Umgang mit Schildern

Optimierung. Optimierung. Vorlesung 7 Lineare Programmierung II Thomas Brox, Fabian Kuhn

Wie wird die Sicherheit sicher gestellt?

1 topologisches Sortieren

Die Invaliden-Versicherung ändert sich

Objektorientierte Programmierung für Anfänger am Beispiel PHP

Fall 3: Mehrere Kapazitätsengpässe

Abschlussprüfung Realschule Bayern II / III: 2009 Haupttermin B 1.0 B 1.1

IRF2000 Application Note Lösung von IP-Adresskonflikten bei zwei identischen Netzwerken

3. LINEARE GLEICHUNGSSYSTEME

Was ich als Bürgermeister für Lübbecke tun möchte

W-Rechnung und Statistik für Ingenieure Übung 11

Übungsaufgaben. Aufgabe 1 Internetsuchmaschinen. Einführung in das Information Retrieval, 8. Mai 2008 Veranstaltung für die Berufsakademie Karlsruhe

Was meinen die Leute eigentlich mit: Grexit?

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

SUCHMASCHINENOPTIMIERUNG FÜR DEN INTERNETAUFTRITT

Wir machen neue Politik für Baden-Württemberg

Grundlagen der Künstlichen Intelligenz

Wurzeln als Potenzen mit gebrochenen Exponenten. Vorkurs, Mathematik

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Zahlen und das Hüten von Geheimnissen (G. Wiese, 23. April 2009)

- Google als Suchmaschine richtig nutzen -

Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage

Kevin Caldwell. 18.April 2012

Maschinelle Übersetzung

4. Dynamische Optimierung

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Beschreibung des MAP-Tools

t r Lineare Codierung von Binärbbäumen (Wörter über dem Alphabet {, }) Beispiel code( ) = code(, t l, t r ) = code(t l ) code(t r )

Informationsblatt Induktionsbeweis

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Datenexport aus JS - Software

Statuten in leichter Sprache

Maximizing the Spread of Influence through a Social Network

Was ist Sozial-Raum-Orientierung?

Die Post hat eine Umfrage gemacht

Alles was Recht ist. Justiz und Recht besser verstehen.

Linearen Gleichungssysteme Anwendungsaufgaben

Die Bundes-Zentrale für politische Bildung stellt sich vor

Erstellen von x-y-diagrammen in OpenOffice.calc

Wichtig ist die Originalsatzung. Nur was in der Originalsatzung steht, gilt. Denn nur die Originalsatzung wurde vom Gericht geprüft.

Arbeit zur Lebens-Geschichte mit Menschen mit Behinderung Ein Papier des Bundesverbands evangelische Behindertenhilfe e.v.

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?

FRAGEBOGEN ANWENDUNG DES ECOPROWINE SELBSTBEWERTUNG-TOOLS

Studieren- Erklärungen und Tipps

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

Geld Verdienen im Internet leicht gemacht

3. Grundlagen der Linearen Programmierung

LimeSurvey Fragetypen

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin:

Basis und Dimension. Als nächstes wollen wir die wichtigen Begriffe Erzeugendensystem und Basis eines Vektorraums definieren.

Eva Douma: Die Vorteile und Nachteile der Ökonomisierung in der Sozialen Arbeit

Reporting Services und SharePoint 2010 Teil 1

Konzepte der Informatik

Zeichen bei Zahlen entschlüsseln

7 Die Determinante einer Matrix

Tutorium Klinische Psychologie I. Fragen zur Ausbildung und rechtlichen Grundlagen in der Klinischen Psychologie

Erfahrungen mit Hartz IV- Empfängern

Erklärung zu den Internet-Seiten von

Internet-Wissen. Browser:

Zahlen auf einen Blick

Alle gehören dazu. Vorwort

Webalizer HOWTO. Stand:

Landes-Arbeits-Gemeinschaft Gemeinsam Leben Gemeinsam Lernen Rheinland-Pfalz e.v.

Mit einem Doppelclick auf den Ortsnamen erhalten Sie eine Liste mit allen Pulheimer Adressen angezeigt.

Anleitung zur Daten zur Datensicherung und Datenrücksicherung. Datensicherung

Grundbegriffe der Informatik

Meinungen zur Altersvorsorge

OECD Programme for International Student Assessment PISA Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

Informationen zum Ambulant Betreuten Wohnen in leichter Sprache

Ihr Weg in die Suchmaschinen

FIS: Projektdaten auf den Internetseiten ausgeben

Datenbanken Microsoft Access 2010

Leit-Bild. Elbe-Werkstätten GmbH und. PIER Service & Consulting GmbH. Mit Menschen erfolgreich

e-books aus der EBL-Datenbank

Zielgruppenansprache von Baumärkten

Konzentration auf das. Wesentliche.

Mathematik. UND/ODER Verknüpfung. Ungleichungen. Betrag. Intervall. Umgebung

Umfrage der Klasse 8c zum Thema "Smartphones"

Anleitung zum erstellen einer PDF-Datei aus Microsoft Word

Datei Erweiterungen Anzeigen!

Dokumentation von Ük Modul 302

Einrichten eines HBCI- Zugangs mit Bank X 5.1

Das Persönliche Budget in verständlicher Sprache

Kosten-Leistungsrechnung Rechenweg Optimales Produktionsprogramm

Transkript:

Lernende Suchmaschinen Qingchui Zhu PG 520 - Intelligence Service (WiSe 07 / SoSe 08)

Verzeichnis 1 Einleitung Problemstellung und Zielsetzung 2 Was ist eine lernende Suchmaschine? Begriffsdefinition 3 Realisierung - Funktion und Algorithmus Die Funktion für lernende Suchmaschinen SVM Algorithmus 4 Ein beispielhaftes Experiment Vergleich der zwei Rangordnungen

Problemstellung und Zielsetzung Problemstellung und Zielsetzung Problemstellung Anfragen liefern potentiell sehr viele Antworten Aber nur wenige davon sind für den Nutzer interessant Z. B. betrachten bei Internet-Suchmaschinen mehr als 90% aller Nutzer nur die ersten 10 Antworten Wie können potentiell relevante Antworten gehäuft am Anfang der Rangliste auftauchen? Zielsetzung Man entwickelt eine lernende Suchmaschine, die diese Probleme lösen kann.

Begriffsdefinition Was ist eine lernende Suchmaschine? Eine lernende Suchmaschine ist eine Suchmaschine mit künstlicher Intelligenz, die selbständig lernt, für wen etwas interessant sein könnte, indem sie die Benutzer befragt.

Begriffsdefinition Beispiel 1.1 ein Suchergebnis Die Frage support vector machine (Figure1)

Begriffsdefinition Trio (q,r,c) Definition Trio (q,r,c) q: Anfrage r: Die Rangliste der Suchergebnisse c: URL-Liste, die der Benutzer gewählt hat Bei Beispiel 1.1 q: support vector machine r: Liste (1,2,3,4,5,6,7,8,9,10) c: (1,3,7)

Begriffsdefinition Welche Information sind relevant? Statistik: die Anzahl der angeklickten Seiten? Nein Niemand will alle Suchergebnisse lesen, wenn sie zu viel sind. Bei Internet-Suchmaschinen betrachten mehr als 90% aller Nutzer nur die ersten 10 Antworten. Man kann nur relativ relevant bestimmen. (bei Beispiel 1.1) Definition r : partielle Information der gesuchte Sortierung der Suchergebnisse link3 < r link2 link7 < r link2 link7 < r link4 link7 < r link5 link7 < r link6

Die Funktion für lernende Suchmaschinen Darstellung der Relation r Für eine Suchergebnisliste gibt es m Dokumente D = {d 1,..., d m } Die Relation r kann man mit einer Matrix M darstellen. (M D D) (d i < r d j ) = (M ij = 1 und M ji = 0) Bei Beispiel 1.1 M= 1 1 0 1 1 1 0 0 0 0 (* unbekannt).

Die Funktion für lernende Suchmaschinen Kendall s τ Definition Kendall s τ r a und r b : zwei Rangliste mit m Dokumente P : Anzahl der übereinstimmenden Paare Q : Anzahl der nicht übereinstimmenden Paare Q+P := ( m 2 ) τ := P Q P+Q = 1 2Q ( m 2 ) Beispiel für 5 Dokumente (m=5) r a : d 1 <r a d 2 <r a d 3 <r a d 4 <r a d 5 r b : d 3 <r b d 2 <r b d 1 <r b d 4 <r b d 5 Q = 3 ((d 2, d 3 ), (d 1, d 2 ), (d 1, d 3 )) P + Q = ( 5 2 ) = 10; τ = 1 6 10 = 0, 4

Die Funktion für lernende Suchmaschinen Präzision Definition r f (q) : Rangliste der Suchergebnisse nach Anfrage q Definition τ(r f (q), r ) : Präzision der Suchergebnisse Minimierung Q Maximierung τ und ( 1 τ(r f (q), r ) 1) Wie groß ist τ(r f (q), r ) Wie groß ist die Präzision der Suchergebnisse

Die Funktion für lernende Suchmaschinen Präzision Maximierung τ(r f (q), r ) ist equivalent zu Minimierung der Summe der Rangnummer der relevanten Dokumente. AvgPrec(r f (q), r ) = 1 R ΣR i=1 i p i Maximierung (R ist Anzahl der relevanten Dokumente; p i ist die Rangnummer). Untere Schranke für AvgPrec(r f (q), r ) AvgPrec(r f (q), r ) 1 R [ Q + ( R+1 2 ( )] R ) 1 i i=1 (1) Ziel : Maximierung τp(f ) = τ(r f (q), r )d Pr(q, r ) Pr(q, r ) : eine Instanz von r für identische q

Die Funktion für lernende Suchmaschinen Beweis zu Formel (1) r rel : die Rangliste, in der alle relevante Dokumente am Anfang auftauchen r sys : Lernende Rangliste p 1, p R : relevante und steigend sortierte Dokumente in r sys. AvgPrec(r sys, r rel ) = 1 R RX i=1 p 1 + + p R = Q + R+1 2 i p i (2) Beispiel 2,2 für 5 Dokumente mit 3 relevante Dokumente r rel : d 1 <r rel d 2 <r rel d 3 <r rel <r rel r f (q) : d 1 <r d 2 <r <r <r d 3 AvgPrec(r f (q), r rel ) = 1 3 ( 1 1 + 2 2 + 3 5 ) = 0, 867 p 1 + p 2 + p 3 = 1 + 2 + 5 = 8 (3)

Die Funktion für lernende Suchmaschinen Beweis zu Formel (1) Das Optimierungsproblem (Minimierung Gl.(2) mit Nebenbedingung Gl.(3)) in der sog. Lagrange-Funktion L(p 1 + + p R, λ) zusammenfassen: L(p 1 + + p R, λ) = 1 R R i=1 i p i + λ δl(p 1 + +p R,λ) δp i δl(p 1 + +p R,λ) δλ ( Σ R i=1 p i Q ( )) R+1 2 = ir 1 p 2 i + λ =. 0. = 0 Im Prinzip kann man die Minimierung (Formel (1)) errechnen.

SVM Algorithmus gewichtete Funktion Für identische q und ihre r : (q 1, r1 ),, (q n, rn ) wählt Lerner L eine Funktion f, so dass τ s (f ) = 1 n n i=1 τ(r f (q i ), ri ) maximiert wird. Man muss ein Algorismus und eine Funktionsfamilie F erzeugen, so dass Lerner f F ein maximales τ s (f ) finden kann. Man definiert eine gewichtete Funktion: (d i, d j ) f ω (q) ωφ(q, d i ) > ωφ(q, d j ) (Definition φ(q, d): siehe Folie 16) Mit unterschiedlichen Gewichtsvektoren ω werden die Dokument unterschiedlich sortiert (siehe Figure2).

SVM Algorithmus Figure2 Mit Gewichtsvektor ω 1 werden die 4 Punkte (1,2,3,4) sortiert; Mit Gewichtsvektor ω 2 werden die 4 Punkte (2,3,1,4) sortiert.

SVM Algorithmus Gewichtsvektoren bei Suchergebnissen φ(q, d) ist ein Diagramm mit der Dimension, die die Eigenschaft zwischen Anfrage q und Dokument d beschreibt. Das folgende Beispiel illustriert die Anwendung der Gewichtsvektoren bei Suchergebnissen: Beispiel-Frage: side effect of drugs on memory and cognitive abilities, not aging t i ω i d 1i d 2i d 3i d 4i side effect 2 1 0,5 1 1 drugs 2 1 1 1 1 memory 1 1 1 cognitive ability 1 1 1 0,5 not aging -2 1 Retrivalgewicht 5 2 6 4,5 Entsprechend den Retrivalgewichten werden die Dokumente in der Reihenfolge d 3 ; d 1 ; d 4 ; d 2 ausgegeben.

SVM Algorithmus Das Optimierungsproblem der Suchergebnisse Maximierung τ s (f ) ist equivalent zu maximalen Erfüllung der folgenden Ungleichung. (d i, d j ) ri : ωφ(q 1, d i ) > ωφ(q 1, d j ) (d i, d j ) rn : ωφ(q n, d i ) > ωφ(q n, d j ) Aber es ist NP-Schwer Problem.

SVM Algorithmus Das Optimierungsproblem der Suchergebnisse Lösung: Einführen SVM Algorithmus Min. V ( ω, ξ) = 1 2 ω ω + C ξ i,j,k mit Nebenbedingung: (d i, d j ) ri : ωφ(q 1, d i ) ωφ(q 1, d j ) + 1 ξ i,j,1 (d i, d j ) rn : ωφ(q n, d i ) ωφ(q n, d j ) + 1 ξ i,j,n i, j, k : ξ i,j,k 0 C ist positiv Konstante, die den Ausgleich zwischen der Minimierung von 1 2 ω ω und der korrekten Klassifizierung der Trainingsbeispiele regelt.

SVM Algorithmus Das Optimierungsproblem der Suchergebnisse ω(φ(q n, d i ) φ(q n, d j )) 1 ξ i,j,n (d i, d j ) f ω (q) ω φ(q, d i ) > ω φ(q, d j ) αk,l φ(q k, d l )φ(q, d i ) > αk,l φ(q k, d l )φ(q, d j ) Grundlegende Idee: Der Vektorraum und die zugehörigen Trainingsdaten sind durch eine Kernelfunktion α k,l φ(q k, d l )φ(q, d i ) in einen Raum mit so hoher Dimension zu überführen, dass sich die Trainingsdaten dort linear trennen lassen.

Vergleich der zwei Rangordnungen Wie kann man zwei Rangordnungen A und B vergleichen? Man kombiniert A und B zu C top l Links von C enthalten top k a Links von A und top k b Links von B k a k b 1 das bedeutet: Die Benutzer können fast gleiche Anzahl Dokument aus A und B lesen. Vergleich der angeklickten Anzahl des Links aus A und B

Vergleich der zwei Rangordnungen Beispiel

Vergleich der zwei Rangordnungen Beispiel jeweils 7 links aus A und B 3 Links werden aus A angeklickt 1 Link wird aus B angeklickt A ist deswegen besser als B.