Erweiterte Boolesche Modelle. Theoretische Kohärenz. Extended Boolean Models. Beispiel: MMM. Das MMM-Modell (cf. Fox et al. 1992)

Ähnliche Dokumente
Einführung in die Computerlinguistik

Der Lagrange- Formalismus

Mögliche Portfolios: Zulässiger Bereich

Abstandsbestimmungen

Selbstorganisierende Neuronale Netze. Neuronale Netze 3. Übung

Musterlösung Serie 4

Ü b u n g s b l a t t 9. r/2 für 0 r < 1, F X (r) = 3/5 für 1 r < 2, (3 r + 1)/10 für 2 r < 3, 1 für 3 r.

Mögliche Portfolios: Zulässiger Bereich

2.6. Wirbelströme und Hysterese

Anfrage-Operationen. Relevance Feedback & Anfrage-Erweiterung

SS 2017 Torsten Schreiber

Inhalt der Vorlesung Experimentalphysik I

Exkurs: Beweisen mit Tableau. Tableau-Methodik. Tableau-Erweiterungsregeln. Tableau-Beweis: Beispiel (1)

Kapitel 13. Das Wasserstoff-Atom Energiewerte des Wasserstoff-Atoms durch Kastenpotential-Näherung

Wir nehmen an, dass die Streuung elastisch ist; d.h., dass die Energie des Teilchens erhalten bleibt. Die Streuung ändert die Wellenfunktion bei r =

7 Möglichkeiten und Grenzen der Simulation

Seminar Algebra. LECTURES ON FORMS IN MANY VARIABLES Funktionenkörper. Sommersemester 2005 Steffen Schölch Universität Ulm Stand: 17.

B.3 Kugelflächenfunktionen und Legendre-Polynome

Zentrale Klausur 2015 Aufbau der Prüfungsaufgaben

Übungen zur Wahrscheinlichkeitstheorie und Statistik

Beweis. herleiten. Ist also z S α, so haben wir eine Darstellung der Form. Da log α die Umkehrfunktion ist gilt somit. log α (z) = x + iy.

Erhebungsbogen für die seelsorgerliche Begleitung/Beratung, Paarberatung und Coaching

5.5 Effekte an Flüssigkeitsgrenzflächen

Leistungskurs Biologie (NRW) Abitur-Prüfung 2016 Aufgabe 3: Genetik / Ökologie

Die Einheitsmatrix E ist das neutrale Element der Multiplikationen; E muss quadratisch sein!

49 Uneigentliche Integrale

2 Entdeckung des Atomkerns - Rutherfordsches Streuexperiment

Aufgabenblatt 2: Grenzplankostenrechnung

Prüfung Grundprinzipien der Versicherungs- und Finanzmathematik 2016

Herleitung der Divergenz in Zylinderkoordinaten ausgehend von kartesischen Koordinaten

passion for precision Toro-SB und Sphero-SB 3D-Frästechnik für rostfreie Stähle

Lösung: 1. Für das Volumen gilt die Formel: V = r 2. π. h = 1000 [cm 3 ]. 2. Für die Oberfläche gilt die Formel: O = 2. r 2. π + 2. r. π. h.

Spezielle Themen der KI Eine Einführung in Prolog und die logische Programmierung

Übungen zur Physik 1 - Wintersemester 2012/2013. Serie Oktober 2012 Vorzurechnen bis zum 9. November

Integration von Ortsgrößen zu Bereichsgrößen

Abituraufgabe Stochastik: Fliesenproduktion

Bildverarbeitung: Diskrete Energieminimierung. D. Schlesinger () BV: Diskrete Energieminimierung 1 / 11

TECHNISCHE UNIVERSITÄT MÜNCHEN

Die Schrödingergleichung für das Elektron im Wasserstoffatom lautet Op2 e2 Or. mit

lassen sich die beiden ersten Eigenschaften von (2,4)- Bäume auch mit binären Knoten erreichen?

Universität Ulm Abgabe: Donnerstag,

Grundlagen der Schallabsorption

Logik-Programmierung und Negation

Transmission monetärer Impulse und Konsequenzen für die Geldpolitik : Monetaristische/Neoklassische Ansätze

Inhalt der Vorlesung A1

1 Ergänzungen zum Themenfeld Vollständige Induktion

5.3 Die hypergeometrische Verteilung

EXPERIMENTE IN DER STRÖMUNGSMECHANIK I: MODELLUNTERUCHUNGEN IM ÜBUNGSLABOR. Experiment e : Übung "Luftfreistrahl"

( ) Parameters α. Links: α < 1. Mitte: α = 1 (Exponentialverteilung). Rechts: α > 1.

STUDIENPRÜFUNGSARBEIT RATIONELLE ENERGIEWANDLUNG. Spule mit Eisenkern. Abgabedatum: Teilnehmer: Ludwik Anton

( ) X t. = dt 2 τ. berücksichtigen, wird im Johnson-Mehl-Avrami-Ansatz in (9.23) künstlich ein Faktor ( ) eingebracht. Abbildung 9.

Stereo-Rekonstruktion. Stereo-Rekonstruktion. Geometrie der Stereo-Rekonstruktion. Geometrie der Stereo-Rekonstruktion

Abiturprüfung Physik, Grundkurs

3.3. Gesamtwirtschaftliche Nachfrage bei festem Preisniveau: Das IS-LM-MP Modell

d) Was ist an dieser Form des Vergleiches nicht korrekt?

Entwicklung eines Verfahrens zur Alignierung des ATLAS-Myonspektrometers mit Spuren

= = = = =

Musterlösung Klausur Mathematik (Wintersemester 2012/13) 1

ASTROLOGICUM Dipl. Astro-Coach Karin Staffa / Karmische Analyse

Teilbereich 5: Exponential Funktionen 1. Grundkursniveau. Hier eine Musteraufgabe mit Lösung Auf CD alles komplett. Datei Nr

Skript Montag Stetigkeit, Funktionengrenzwerte, Ableitung und Taylorentwicklung

Statische Magnetfelder

Lösungshinweise/-vorschläge zum Übungsblatt 12: Grundlagen der Programmierung (WS 2018/19)

1 Umkehrfunktionen und implizite Funktionen

Gradientwindgleichung. Strömungsverhältnisse bei gekrümmten Isobarenverlauf

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Rechtschreibspiele, motivierend & effektiv

Vorbereitungsunterlagen 4. Kleingruppe GEMB- Dielektrische Polarisation

Abitur - Leistungskurs Physik. Sachsen-Anhalt 2008

Mathematik: Mag. Schmid Wolfgang Arbeitsblatt Semester ARBEITSBLATT 15 DER KREIS

ϕ = 3dB Öffnungswinkel im H-Feld

Einführung in die Finanzmathematik - Grundlagen der Zins- und Rentenrechnung -

1. Übungsblatt zur Theoretischen Physik I im SS16: Mechanik & Spezielle Relativitätstheorie. Newtonsche Mechanik

Vorlesung Technische Mechanik 1 Statik, Wintersemester 2007/2008. Technische Mechanik

X. ANALYTISCHE ANWENDUNG DES IS/LM MODELLS

Symposium EME September 2005 d. Numerische Feldberechnung im VCC EME - aktueller Sachstand und zukünftige Entwicklungen

Abweichung 2. Grades wird der Preisabweichung zugerechnet.

Abbildung 9: zweiatomiges Molekül mit Bindungselektron. 2 e e e H

Kardioiden INTERNETBIBLIOTHEK FÜR SCHULMATHEMATIK. FRIEDRICH W. BUCKEL. Text Nr Stand 11. Mai 2016

Inhaltsverzeichnis. 1. Übungsaufgaben zur Hochfrequenz

Klausur 2 Kurs Ph11 Physik Lk

Messtechnik und Modellierung in der Kardiologie

Ixekizumab (Taltz ) (frühe Nutzenbewertung)


Wintersemester 2012/2013 Prof. Dr. Stefan Müller AG Computergraphik km 2 0,1571 0, km 2. r d. 4πI

Abb. 1: Tangentenviereck. 2 Tangentenviereck Ein Viereck mit den Seiten a, b, c, d ist genau dann ein Tangentenviereck, wenn gilt: a + c = b + d (1)

Neunte Vorlesung: Die Kruskal-Metrik

k r Reziprokes Gitter Abb. 1 Elektronenbeugung im TEM. Die RG-Vektoren sind sehr viel kürzer als k o senkrecht dazu.

Konservatives Kraftfeld. Nullpunkt frei wählbar (abh. von Masse m) E pot bezogen auf Probemasse (unabh. von Masse m)


Klausur in Mikroökonomie 1

Physik II TU Dortmund SS2018 Götz Uhrig Shaukat Khan Kapitel 5

Unterlagen Fernstudium - 3. Konsultation

Tracking, Teil 1: Einführung

Extremwertaufgaben

Gruppentheoretische Methoden in der Physik 1 Prof. Dr. H.-R. Trebin Auszug aus dem Vorlesungsmanuskript, WS 06/07


Pfadwahrscheinlichkeiten

Mathematik für Ingenieure 2

5 Kryptoanalyse von Bitblock-Chiffren

Transkript:

Eweitete Boolesche Modelle Altenative: Mischung aus Booleschem und gewichtetem Retieval Idee: Vebindung: Boolesche Anfage und geankte Output Voaussetzung: Gewinnung von Ranking- Infomation aus exakten Booleschen Anfagen Theoetische Kohäenz Widespuchsfeie Abbildung de Anfagen d.h. Logikkonfomität des Mischmodells unteschiedl. Ausducksmöglichkeiten gleiche Inhalte müssen übe Tansfomationen geegelt weden IR 67 IR 68 Ausschöpfen de Booleschen Möglichkeiten b OR NOT (NOT a) NOT (b AN (NOT a)) NOT b OR NOT (NOT a) (b AN a) OR (c AN NOT a) x OR (NOT x) a AN (b OR c) (a AN b) OR (a AN c) Logik-Konfomität duch Tansfomationen IR 69 Extended Boolean Models as MMM-Modell (Mixed Min and Max) as Paice-Modell as P-Nom-Modell IR 70 as MMM-Modell (cf. Fox et al. 1992) Teme bilden unschafe Mengen okumentgewicht wid als Zugehöigkeit intepetiet MIN und MAX wid als Kontinuum intepetiet Beispiel: MMM SIM (Q o, ) = C o1 *max(d A1, d A2,..., d An ) + C o2 * min (d A1, d A2,..., d An ) SIM (Q and, ) = C and1 * min (d A1, d A2,..., d An ) + C and2 *max(d A1, d A2,..., d An ). C o1 und C o2 sind Weichheitskoeffizienten wobei gilt: C o1 > C o2 und C and1 >C and2 C o1 + C o2 =1; C and1 + C and2 =1 fü C and1 Beeich 0,5 bis 0,8; C o1 Beeich >0,2 IR 71 IR 72 1

Beispiel: P-Nom-Modell (Salton 1989,354) B 0,0 x 1,1 A 0,0 OR AN B x A 1,1 as Pobabilistische Modell: stochastische Gundlagen Bedingte Wahscheinlichkeit Wahscheinlichkeit, daß die Aussage A zutifft, unte de Voaussetzung, daß eine andee Aussage B gilt Instument, um Beziehungen zwischen Aussagen auszudücken (Bayessche Infeenz) K A) K A) = A) IR 73 IR 74 Beziehung zwischen Antezedent und Konsequent Pobabilistisches IR Symptom iagnose Sensitivität Spezifizität Abbildung S Kopfschmezen Ekältung geing geing Zahnschmezen Kaies geing hoch S Kopfschmezen Mumps hoch geing S beidseitig geschwollene Wangen Mumps hoch hoch SS Tab. 2.1: Zusammenhang zwischen Symptom und iagnose ausgedückt duch Sensitivität und Spezifizität IR 75 K K A) A) = A) K und A als eskipto K und A als Anfage und okument IR 76 Zusammenfassung: Modelle Boolesches Modell Vekto-Raum-Modell pobabilistisches Modell Fuzzy-Modelle Extended Boolean Models Voteile von Ranking-Vefahen ie Rangodnung eiht die elevantesten okumente an den Anfang de Folge e Benutze bestimmt den Abbuch selbst, d.h. keine Mengenpobleme Expeimente zeigen bessee Retievalqualität (beeits fü seh einfache Vefahen) cf. Salton et al. 1983 IR 77 IR 78 2

Gundpinzip Ranking Index okumente Anfage Gewicht / Rankingwet po okument-anfage-relation Opeationalisieung de Gewichtung Basis: Teme und deen Vokommen (Fequenz und Veteilung) Welche Teme sind gute Indikatoen zu Modellieung des okumentinhalts? Hochfequenten Teme? Niedigfequenten Teme? (Hapax) Mittelfequenten Teme? IR 79 IR 80 Vogehen fü ein gewichtetes Indexieungsmodell Bestimmung: Was ist ein Tem? Wotgenzen, Mehwotbegiffe, Stopwöte Zahlen, Abküzungen, Sondezeichen Bestimmung des Beitags dieses Tems zu Inhaltsmodellieung des okuments Gewichtungsmodelle Poblem: Wohe kommen die Gewichte? Ansätze: - fomal (z.b. Fequenzen) - heuistisch - empiisch - Auf de Basis von Relevanzuteilen kann Optimieung efolgen IR 81 IR 82 Temgewichtung Zwei Gundhäufigkeiten: Temfequenz in de Kollektion Temfequenz in einem okument Relativieung an de okumentlänge (Anzahl de types od. tokens) de Anz. de okumente mit best. Tem Kollektionsgöße (Anz. de okumente ode Anz. de tokens) Gewichtung auf de Basis de Kollektionsfequenz Beispiel: Invese ocument Fequency (IF) hie wiken die Tem Exhaustivity (ecall-device) und Tem Specificity (pecision device) z.b. Auto ist spezifische als Fahzeug BMW ist spezifische als Auto Gute Index enthält beides Fomel: IF t = N/n wobei N Anzahl de ok. in de Kollektion n Anzahl de ok., die t enthalten IR 83 IR 84 3

Gewichtung auf de Basis de Kollektions- und okumentfequenz Beste eskiptoen sind die, welche die okumente am besten vom Rest de Kollektion diskimieen Beispiel Gewichtungsschema von Coft 1983 feqij cfeqij = K + ( 1 K) max feq wobei feq ij Fequenz eines Tems i im okument j maxfeq i maximale Fequenz igendeines Tems in ok. j ij Gewichtung auf de Basis von Relevanzinfomation Basis: Kenntnis de Veteilung de Teme übe elevanten und nicht-elevante okumente Pinzip: elevance feedback K ist Konstante zu Modifizieung IR des Maßes 85 IR 86 Ranking-Liste mit Relevanzinfomation 1. okument A 2. okument X 3. okument H 4. okument B 5. okument F etc. IR 87 Gewichtung duch Einbeziehung von Relevanzinfomation Wissen übe die Veteilung de Teme in elevanten und nicht-elevanten okumenten w 1 = log R Beispiel: n N IR 88 Fomel (1) ( w 1 = log ( R n N ) ) Fomel (2) w = log R n N R IR 89 IR 90 4

Fomel (3) w4 = log R n N n R+ IR 91 Wobei N = Anz. de okumente in de Kollektion n = Anz. de okumente, die Tem t enthalten R = Anz. de elevanten okumente auf Anfage q = Anz. de elevanten okumente, die Tem t enthalten Veteilung de Teme übe elevante und nichtelevante okumente IR 92 Beispiel: Wikung von Relevance Feedback Einbeziehung de okumentstuktu (1) Anfage Egebnis t 1 t 2 t 3 d 5 d 7 d d 11 12 d 15 el el IR 93 okumentstuktu ist domänenabhängig (d.h. Stuktu hat unteschiedliche Semantik) Beispiel: Patente, wiss. Atikel, Expeimente Titel, Abstact, Bescheibung, State-of-the- At, Hauptanspuch, Nebenanspüche, Zeichnung mit textuellen Veweisen IR 94 Einbeziehung de okumentstuktu (2) Beispiel: WENN ein Tem in exponieten okumentteilen vokommt, ANN ehält e ein stäkees Gewicht. Fagen: Was sind die wichtigen Teile? Welches Gewicht soll de Tem ehalten? s. z.b. Womse-Hacke / Zettel 1997 e amstädte Indexieungsansatz (IA) cf. Knoz 1983, Lustig 1986, Fuh 1988 vollautomatische Indexieung eskiptoen kommen aus einem Thesauus Indexieung fü englische Titel+Abstacts Wötebuch, das alle eskiptoen mit den zugehöigen Thesauustemen enthält IR 95 IR 96 5

Relationen zwischen Temen und eskiptoen fü die Gewichtung wid eine komplexe Hinweisbescheibung angelegt Fom des Vokommens statistische Angaben übe den Tem Relation koekt dann, wenn de Tem auch von einem menschlichen Indexiee vegeben wude Eweiteung des Booleschen Modells duch Ranking- Funktionalität Beispiel: 1. Anfage: (infomation etieval OER database access OER knowledge finding)... 2. RANKING-Algoithmus 1. 2. 3. 4. 5. 6. 7.... n... Abb. 3.5: Eweiteung von Booleschem Retieval duch Ranking-Vefahen IR 97 IR 98 Anfage n Quoum-Level-Seach Hieachie Anz. de ok. 0 (A and B and C and ) 2 2 1 (A and B and C) o (A and B and ) o (A and C and ) o (B and C and ) 6 5 2 (A and B) o (A and C) o (A 23 15 and ) o (B and C) o (B and ) o (C and ) 3 A o B o C o 86 25 Anz. de el. ok. Fazit: Gewichtungsschemata Es gibt seh viele veschiedene Möglichkeiten de Gewichtung. Vegleich duch Evaluieungsstudien Poblem: Isolation de Wikung schwieig IR 99 IR 100 Tends aus Haman 1992 Temgewichtung auf de Basis de Kollektionsfequenz füht zu Vebesseungen Kombination von okument- und Kollektionsfequenz kann diese Vebesseungen noch ehöhen alledings abhängig von vesch. Faktoen Nomalisieung nötig okumentlänge spielt eine Rolle (fü Ti+Ab ungeeignet) poblematisch bei manuell indexieten okumenten ode Thesauusbenutzung IR 101 6