4 Multimedia Information Retrieval

Ähnliche Dokumente
Suche in Multimedia-Datenbanken

Übersicht der Vorlesung

Information Retrieval

Objektorientierte Bildverarbeitung Methodische Grundlagen

Information Retrieval

Inhalt. Unland, Rainer Datenbanken im Einsatz digitalisiert durch: IDS Basel Bern

Einführung. Information Retrieval. IR-Aufgaben. IR in Beispielen. Adhoc-Suche: Web. IR in Beispielen. Was ist IR? Norbert Fuhr

Kontextbasiertes Information Retrieval

Multimedia-Datenbanken. Ingo Schmitt Vorlesung im SS 2006

Kapitel 2: Mathematische Grundlagen

Inhaltsverzeichnis. Kurzfassung. Abstract

SEMACODE: Semantische Kodierung von Bildern

Inhaltsverzeichnis. Grundlagen

DBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität

Standards für archivtaugliche Dateiformate im Kanton Luzern

Inhaltsverzeichnis. Einführende Bemerkungen 11. Das Fach Informatik 11 Zielsetzung der Vorlesung Grundbegriffe

Ein Structure and Motion Ansatz zur Umfeldrekonstruktion in komplexen Fahrzeugumgebungen

Vortrag Iterative Prozessmodelle/SCRUM

Gedächtnis. Extern gewonnene Informationen werden in drei Stufen verarbeitet:

INTELLIGENTE DATENANALYSE IN MATLAB

Zur Beschreibung datenbasierter Parametrisierung von Softwarekomponenten

DEUTSCHE SCHULE MONTEVIDEO BIKULTURELLES DEUTSCH-URUGUAYISCHES ABITUR ( AUF SPANISCH )

Navigation anhand natürlicher Landmarken mit Hilfe der Scale Invariant Feature Transform. Thorsten Jost INF-M2 AW1 Sommersemester

Implizite Modellierung zur Objekterkennung in der Fernerkundung

Algorithmen & Programmierung. Steuerstrukturen im Detail Selektion und Iteration

T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente.

Inhaltsverzeichnis. Vorwort...

Verkehrslageberechnung mit Floating Car Data und GIP Karl Rehrl, Salzburg Research Präsentation beim GIP Day 2014, 4.7.

Einführung. Internet vs. WWW

WMS Block: Management von Wissen in Dokumentenform PART: Text Mining. Myra Spiliopoulou

Dateiformat für Doc-Safe. Anforderungen Vergleich von Standardformaten serverseitige Konvertierung Vorschau usw...

Datenvorverarbeitung von nominalen Daten für Data Mining

(query by image content)

Langzeitarchivierungsaspekte. im Dokumentenlebenszyklus

Seminar Datenbanksysteme

WS 2009/10. Diskrete Strukturen

J. Reinier van Kampenhout Robert Hilbrich Hans-Joachim Goltz. Workshop Echtzeit Fraunhofer FIRST

Modulhandbuch für das BA Kombinationsfach Angewandte Informatik Multimedia

Recordersoftware Version SP C

Einführung in die höhere Mathematik 2

Temporale Daten in objekt-relationalen Datenbanksystemen

Theoretische Informatik 1 WS 2007/2008. Prof. Dr. Rainer Lütticke

Clusteranalyse. Anwendungsorientierte Einführung. R. Oldenbourg Verlag München Wien. Von Dr. Johann Bacher

BERUFSPRAKTIKUM UND -VORBEREITUNG

C für Java-Programmierer

Diskrete Strukturen Kapitel 1: Einleitung

- Gewinnung neuer Informationen durch Berechnungen - Einsatz graphischer Mittel zur Präsentation / Visualisierung von Datenreihen

Geodatenbanksysteme in Theorie und Praxis

COPE COuPled Evolution of metamodels and models

Repetitorium Informatik (Java)

Begleitmaterial zum Buch Statistik, Ökonometrie und Optimierung: Methoden und praktische Anwendungen in Finanzanalyse und Portfoliomanagement

Dirk Lewandowski. Web Information Retrieval Technologien zur Informationssuche im Internet. DGI-Schrift (Informationswissenschaft 7}

Problemreduktion durch Transformation am Beispiel des. Erweiterten Euklidschen Algorithmus

MDRE die nächste Generation des Requirements Engineerings

Inhaltsverzeichnis. Teil 1 - XM L Einleitung Motivation...15

Algorithmen und Datenstrukturen (für ET/IT)

Datenbankentwurf. Entwicklungsprozess Anforderungsanalyse & Miniwelt

Weiterentwicklung digitaler Bibliothekssysteme zu OpenArchives-Systemen


Einleitung Projektion Selektion Join Mengenop. Vollst.keit. Einleitung Projektion. Selektion Join. Vollst.keit. Einleitung Projektion Selektion Join

FACHCURRICULUM KL. 9. Raum und Form Figuren zentrisch strecken Üben und Festigen. Strahlensätze. Rechtwinklige Dreiecke.

Inhaltsbasierte Bildsuche. Matthias Spiller. 17. Dezember 2004

Star Join & Kostenbasierte Optimierung. Architektur von Datenbanksystemen II

Grundlagen der Informatik I (Studiengang Medieninformatik)

Aus Alt mach Neu Einführung eines Redaktionssystems unter Berücksichtigung von Altdaten

Anforderungen mobiler Routenplaner an Datenbanksysteme

Einstieg in die Informatik mit Java

Informatik. Teil 1 Wintersemester 2011/2012. Prof. Dr.-Ing. habil. Peter Sobe Fachkultät Informatik / Mathematik

JPEG, MPEG & Co. Alex Titze Angewandte Informatik FHTW-Berlin

Studiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel

Dynamisches Retrieval von multimedialen Daten auf parallelen Architekturen

Michael Artin. Algebra. Aus dem Englischen übersetzt von Annette A'Campo. Birkhäuser Verlag Basel Boston Berlin

Probe-Klausur zur Vorlesung Multilinguale Mensch-Maschine Kommunikation 2013

SEDRIS als Datenmodell für eine synthetische 3D-Umweltdatenbasis

1. Motivation / Grundlagen 2. Sortierverfahren 3. Elementare Datenstrukturen / Anwendungen 4. Bäume / Graphen 5. Hashing 6. Algorithmische Geometrie

Web Data Mining. Alexander Hinneburg Sommersemester 2007

Industrie 4.0 und Smart Data

Informatik Fokussierte Informationsadaption am Beispiel. Astrid Lubinski Universität Rostock

Mencoder und MeGui, Jennifer Möwert Digitales Video. Mencoder und MeGui. Digitales Video, Jennifer Möwert

Dynamische Programmierung. Problemlösungsstrategie der Informatik

Einführung Grundbegriffe

Multimediatechnik / Video

Grundlagen: Bildbearbeitung / Objekterkennung. Julia Peterwitz zum Seminar: Videobasierte Erkennung und Analyse menschlicher Aktionen

Ein Projekt der. Aktive Audioarbeit. "Sprechende Bilder" basierend auf HTML5

Programmierpraktikum WS 16/17

Technische Universität Wien Institut für Computergraphik und Algorithmen Arbeitsbereich für Algorithmen und Datenstrukturen

Transkript:

1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia Information Retrievals 3.Daten eines Multimedia-Retrieval-Systems 4.Feature 5.Eignung verschiedener Retrieval-Systeme

2 4.1 Einführung 1.Besonderheiten der Verwaltung und des Retrievals von Multimedia-Daten 2.Ablauf des Multimedia Information Retrievals

3 Besonderheiten der Verwaltung und des Retrievals von Multimedia-Daten im Vergleich zu Textdokumenten Datenvolumen: großer Speicherplatzbedarf (z.b. Video-Objekte) implizierte Semantik: nutzerrelevante Semantik implizit in Medien-Objekten Heterogenität: viele Medien-Typen und Speicherformate

4 Besonderheiten der Verwaltung und des Retrievals von Multimedia-Daten im Vergleich zu Textdokumenten (Forts.) komplexe Multimedia-Objekte: Kombination verschiedener Medien-Typen, Referenzen und Einbettung Ein-/Ausgabegeräte: Geräte für Datenimport und Darstellung

5 Datenvolumen Reduzierung des Datenvolumens durch Komprimierung verlustfrei versus verlustbehaftet schnelle Algorithmen für Vorverarbeitung der Medien-Objekte und Ähnlichkeitsberechnung

6 Datenvolumen (2) zeitkritische Medien-Typen erfordern ausgeklügelte Resourcen-Verwaltung Beispiel: Video-Archiv auf Tertiärspeicher kompakte Präsentation (etwa Thumbnails)

7 Implizite Semantik nutzerrelevante Semantik ist häufig nicht explizit z.b. Bildobjekte implizit in Pixeldaten Extraktion von Feature-Werten nötig zur expliziten Quantifizierung bestimmter Eigenschaften

8 Implizite Semantik (2) Feature-Extraktionsalgorithmen isolieren semantiktragende Eigenschaften aus Medien-Objekten (Probleme: z.b. Objekterkennung auf Rasterbildern)

9 Implizite Semantik (3) Problem: Semantik ist subjektiv z.b. Rasterbilder: ein Nutzer interessiert sich für Gebäude, der andere für Personen Ideal: exakte, objektive, semantikunterstützende Feature-Extraktion

10 Implizite Semantik (4) jedoch: wenn automatisch ungenau und low-level Semantik wenn manuell aufwändig, subjektiv, aber high-level Semantik Anfragesprache muss Spezifikation von Suchbedarf ermöglichen

11 Heterogenität unterschiedliche Medien-Typen und Speicherformate erfordern unterschiedliche Feature-Extraktion und Ähnlichkeitsberechnungen

12 Heterogenität (2) System muss Erweiterung um neue Typen und Formate ermöglichen Datenunabhängigkeit: medientyp- und speicherformatunabhängige Anfragen z.b. zeige alle Medien-Objekte zu einer Person an

13 Heterogenität (3) Medien-Umsetzung: etwa Umwandlung Text in Audio Speicherformatumwandlung spezielle Metadaten bzgl. Medien-Typ und Speicherformat notwendig

14 Komplexe Multimedia-Objekte komplexes Medien-Objekt: enthält mehrere eigenständige Medien-Objekte Aggregation durch Referenzierung und Einbettung für Verwaltung: Zerlegung in nichtkomplexe Medien-Objekte und Strukturdaten

15 Komplexe Multimedia- Objekte (2) Verwaltung von Strukturdaten zur Rekonstruktion und Retrieval Beispiel: Word-Dokument enthält Text und Bilder Beispiel: Comics enthalten Figuren und Sprechblasen (Text) Aggregation aufgrund Segmentierung Beispiel: Segmentierung auf Bildern in Vordergrundobjekte und Hintergrund

16 Vor der Segmentierung

17 Segmentiert

18 Ein-/Ausgabegeräte Abhängigkeit von Medien-Typ und Speicherformat Bild Bildschirm, Ton Lautsprecher,.. System muss Gerät des Nutzers kennen Nutzer- und Hardware-Profile mit Präferenzen

19 Ein-/Ausgabegeräte (2) System verwendet Profil zur Unterstützung der Anfrageformulierung garantierten Darstellbarkeit von Anfrageergebnissen erfordert u.u. Medienumsetzung oder Speicherformatumwandlung Optimierung: Reduzierung benötigter Resourcen etwa Netzwerkbandbreite

20 Zusammenfassung

21 4.2 Ablauf des Multimedia Information Retrieval

22 5 Aktionen 1.Einfügen in die Multimedia-Datenbank 2.Extraktion der Feature-Werte 3.Aufbereitung der Anfrage 4.Anfragebearbeitung und Ähnlichkeitsberechnung 5.Ergebnisaufbereitung

23 Dynamische versus statische Feature-Extraktion statisch: Anfrageaufbereitung nach der Feature-Extraktion Vorteil: Geschwindigkeit durch Verwendung spezieller Indexstrukturen Nachteil: unflexibel bzgl. unvorhersehbaren Ähnlichkeitsanfragen vordefinierte Features: z.b. in ORDBMS Farbverteilung, Textur, Gestalt

24 Dynamische versus statische Feature-Extraktion (2) dynamisch: Feature-Extraktion nach der Anfrageaufbereitung Vorteil: flexible Anpassung der Feature- Extraktion an Anfrage Nachteil: hoher Aufwand Kombination vorhandene Feature-Werte verwenden wenn nötig, neue extrahieren und aufbewahren

25 Verwaltung und Retrieval von Multimedia-Daten: Ablauf (1)

26 Verwaltung und Retrieval von Multimedia-Daten: Ablauf (1)

27 Einfügen in die Multimedia- Datenbank Unterscheidung Multimedia-Objekte, Metadaten, Strukturdaten und relationale Daten Metadaten: etwa bzgl. Medien-Typ, Speicherformat, Profildaten relationale Daten: etwa Namen von abgebildeten Personen, Aufzeichnungszeitpunkt

28 Einfügen in die Multimedia- Datenbank (2) Zerlegung komplexer Multimedia-Objekte in nichtkomplexe Multimedia-Objekte und Strukturdaten Normalisierung der Medien-Objekte zur Unterdrückung von Störfaktoren z.b. Verzerrungen bei Bildaufnahmen, Hintergrundgeräusche bei Audio-Daten

29 Einfügen in die Multimedia- Datenbank (2) Segmentierung der Medien-Objekte z.b. Bildsegmentierung in Regionen, Videosegmentierung in Szenen

30 Extraktion der Feature-Werte Feature-Erkennung: Algorithmen zur Ableitung von Feature-Werten Abhängigkeit von Medien-Typ und Speicherformat, beabsichtigte Ähnlichkeitsberechnung Beispiel: Gabor-Filter für Texturen, Bewegungsvektoren in Video-Objekten

31 Extraktion der Feature-Werte (2) Feature-Aufbereitung Skalierung Entfernen von Abhängigkeiten Entfernen überflüssiger oder vernachlässigbarer Feature-Werte z.b. KLT, LSI Ablegen im Feature-Index

32 Aufbereitung der Anfrage Anfrage zerlegbar in klassische und Ähnlichkeitsanfrage Optimierung der klassischen Anfrage Ähnlichkeitsanfrage anhand Anfrageobjekt: Schritte wie beim Einfügen in Datenbank und Extraktion

33 Anfragebearbeitung & Ähnlichkeitsberechnung Ähnlichkeitsanfrage: Berechnung der ähnlichen Objekte anhand Ähnlichkeitsfunktion unter Ausnutzung Feature-Index bei komplexen Ähnlichkeitsanfragen: Zerlegung und anschließende Kombination der Ergebnissequenzen

34 Anfragebearbeitung & Ähnlichkeitsberechnung (2) Kombination auch mit Ergebnis der klassischen Datenbankanfrage Beispiel: Suche nach Gemälde von Caspar David Friedrich mit Abendstimmung Problem: klassisches Retrieval + Ähnlichkeitssuche (mögliche Erweiterungen: probabilistische Relationale Algebra, Fuhr et al.)

35 Kombination von Ergebnissequenzen Suche nach Bildern mit Sonnenuntergang

36 Ergebnisaufbereitung Anpassung an Vorgaben des Anwenders (Nutzer- und Geräteprofile) Medienumsetzung, Formatumwandlung, Transformationen, Rekonstruktion komplexer Objekte Optimierung Medien-Daten in verschiedenen Formaten vor Anfrage anlegen Reihenfolge von Transformationsschritten

37 Ergebnisaufbereitung (2) zeitliche und räumliche Anordnung der Ergebnisobjekte Interaktion mit Nutzer gewährleisten z.b. play, stop, rewind bei Video-Objekten

38 Relevance Feedback Ergebnisbewertung Anpassung von Parametern des Systems anhand der Bewertungen Durchführung der Iterationen

39 4.3 Daten eines Multimedia- Retrieval-Systems

40 Klassifikation der Daten Medien-Objekt: Daten eines Medien-Typs textuell oder nicht-textuell Multimedia-Objekt: Kombination mehrerer Medien-Objekte Zerlegung in Medien-Daten und Strukturdaten sinnvoll

41 Klassifikation der Daten (2) Strukturdaten: nicht-textuell durch Graphen oder textuell, etwa durch Hypertextmechanismen von Markup-Sprachen weitere Daten

42 Beispiel: Zerlegung eines Multimedia-Objekts HTML-Datei:

43 Beispiel: Zerlegung eines Multimedia-Objekts (2) Zerlegung in mo-001.html:

44 Beispiel: Zerlegung eines Multimedia-Objekts (3) und Strukturdaten:

45 Klassifikation der Metadaten

46 Klassifikation der Metadaten (2) inhaltsunabhängig: wichtig für Verwaltung und Interpretation inhaltsbezogen: Semantik auf niedriger Abstraktionsstufe, aber automatisch Extrahierbar

47 Klassifikation der Metadaten (3) inhaltsbeschreibend: Semantik auf hoher Abstraktionsstufe, kaum automatisch extrahierbar objektbeschreibend: Beschreibung einzelner Medien-Objekte kontextbezogen: Beschreibung von Medien- Objekten bezogen auf Kollektion von Medien- Objekten kontextbeschreibend: Beschreibung einer Kollektion von Medien-Objekten

48 Beispiel inhaltsunabhängige und -bezogene Metadaten

49 Beispiel inhaltsbeschreibende Metadaten textuelle Objektbeschreibung: Multimedia- Objekt enthält Kontaktinformation und Passfoto von Mitarbeiter Franz Klammer nicht-textuelle Objektbeschreibung: Relation mit Namen und Adressen von auf Passfotos dargestellten Personen

50 Beispiel inhaltsbeschreibende Metadaten (2) kontextbeschreibende Metadaten: Kollektion enthält Mitarbeiterdaten einer Abteilung kontextbezogene Metadaten: Zeitpunkt der Aufnahme der jeweiligen Fotos

51 Alternative Klassifikation von Meyer-Wegener Rohdaten: Daten der Medien-Objekte Registrierungsdaten: speicherungsbezogene Metadaten Beschreibungsdaten: inhaltsbeschreibende und inhaltsbezogene Metadaten

52 Anfragearten und Suchstrategien relationale Anfrage: SQL-Anfrage an relationales DBS nicht-textuelle Strukturdaten, weitere Daten, inhaltsunabhängige und nichttextuelle, inhaltsbeschreibende Metadaten Anfragen an semi-strukturierte Textdaten (XML, HTML, VRML)

53 Anfragearten und Suchstrategien (2) Text-Retrieval textuell formulierte Daten und Metadaten Multimedia-Retrieval erweiterung Text-Retrieval um weitere Medien-Typen Browsen sequentielles Durchblättern der Datenbank

54 4.4 Feature 1.Feature-Extraktion und Invarianzen 2.Feature-Datentypen 3.Feature-Aufbereitung

55 Abgeleitete Metadaten

56 Semantische Lücke begrenzte semantische Ausdruckskraft automatisch extrahierter Feature-Werte keine Objekterkennung i.a. möglich Lücke zwischen menschlicher Inhaltsbeschreibung und Ausdruckskraft automatisch abgeleiteter Feature: semantische Lücke

57 Semantische Lücke (2) Beispiel: Bildsuche nach Fliegenpilz anhand Farbverteilung und Form von Bildsegmenten; Fehler bei rotweißem Spielball Fazit: Feature repräsentieren i.a. low-level- Semantik

58 Datentypen Datentyp für Medienobjekte: Menge von N Medienobjekten: Datentyp für Segmentspezifikation: Menge von Segmentierungsfunktionen bezüglich Algorithmus A:

59 Datentypen (2) Segmentierungsfunktion bildet Medienobjekt auf Menge von Segmentspezifikationen ab: S ist Menge von Segmenten:

60 Datentypen (3) Menge von Feature-Funktionen Feature-Datentyp für Eigenschaft E: Feature-Funktion:

61 Beispiel Datentyp: Sammlung von Rasterbildern Datentyp für Rasterbild: Segmentierung und Feature-Extraktion anhand globaler, lokaler Farbverteilung, Form und Textur; Feature-Funktionen:

Beispiel Datentyp: Sammlung von Rasterbildern (2) vereinfachte Feature-Datentypen: 62

63 Feature-Extraktion und Invarianzen Anforderungen an Feature-Extraktion Adäquatheit: Werte müssen Eigenschaft angemessen ausdrücken effiziente Berechnung Berücksichtigung von Invarianzen: Unabhängigkeit von ungewollten Eigenschaften

64 Feature-Extraktion und Invarianzen Anforderungen an Feature-Extraktion (Forts.) Minimalität: minimale Anzahl von Feature- Werten Orthogonalität: orthogonale Feature-Werte

65 Feature-Extraktion und Invarianzen (3) Feature-Extraktion = Feature-Erkennung + Feature-Aufbereitung

66 Invarianzen Beispiele von Störungen: verfälschende Lichtverhältnisse bei Foto- Aufnahmen Knackgeräusche bei Tonaufnahmen Artefakte bei Videoaufzeichnungen

67 Invarianzen (2) Unabhängigkeit von bestimmten Operationen, z.b.: Rotation, Translation, Skalierung von Bildern Farbverschiebung bei farbbasierten Features Lautstärkeänderung bei gesprochenen Texten

68 Invarianzen und Haar-Integral Feature-Extraktionsfunktion soll unabhängig von parametrisierbarer Transformationsfunktion g sein Menge G enthalte alle anhand g parametrieierten Transformationsfunktionen

69 Invarianzen und Haar- Integral (2) invariante Extraktionsfunktion: diskrete Parametrisierung:

70 Beispiel Haar-Integral Feature-Extraktion f auf Grauwertbild I Invarianz bzgl. Translation und Rotation von Punkten p

71 Beispiel Haar-Integral (2) Anwendung auf -Grauwertbild mit Modulo-Berechnung: Optimierungen zur effizienten Berechnung möglich (hier nicht diskutiert)

72 Allgemeine und spezielle Invarianzen allgemeine Invarianzen werden eher generell für Feature gefordert (etwa Störfaktoren) Normalisierung beseitigt Störfaktoren Beispiel: Unabhängigkeit von Textlänge bei Textdokumenten Beispiel: Auflösung und Dateiformat von Rasterbildern

73 Allgemeine und spezielle Invarianzen spezielle Invarianzen werden eher für bestimmte Feature gefordert Beispiel Meeresaufnahmen: Ausrichtung der Wellen sei irrelevant Beispiel Suche nach Stoffmustern: Invarianz bzgl. Rotation

74 Allgemeine und spezielle Invarianzen spezielle Invarianzen (Forts.) Problem mit speziellen Invarianzen: Abhängigkeit von konkreter Anfrage schwer vorhersehbar dynamische Feature-Extraktion

75 Feature-Datentypen Abhängigkeit von gewünschter Eigenschaft und Extraktionsalgorithmus häufige Datentypen:

76 Umwandlung in Punktdatentyp Punktdatentyp ist relativ universell und Ausgangspunkt vieler mathematischer und algorithmischer Verfahren Intervall: pro Intervall zwei Dimensionen unten, oben sind einzelne Werte Problem Abhängigkeit: unten oben Mittelwert und Intervallbreite Problem Abhängigkeit am Rand des Wertebereichs

77 Umwandlung in Punktdatentyp (2) Binärdaten: pro Eigenschaft eine Dimension mit Wertebereich {0,1} Sequenz und Region: Problem variable Werteanzahl; ein Ausweg: Anwendung diskreter Fouriertransformation Abbilden auf feste Anzahl Fourierkoeffizienten Vorteil: Kompaktheit, Abbildungsfehler nicht lokalisierbar

78 Feature-Datentyp Histogramm häufig verwendeter Datentyp legt Menge disjunkter n-dimensionaler Intervalle (Bins) fest pro Bin ein Häufigkeitswert Beispiel: Farbhistogramm im 3-dimensionalen Farbraum

79 Feature-Datentyp Histogramm (2) Varianten von Histogrammen: feste Anzahl einheitlicher Intervalle Punkdatentyp variable Anzahl und variable Intervalle oder Darstellung Intervall durch Zentroid (Punkt)

80 Feature-Datentyp Histogramm (2) Varianten von Histogrammen (Forts.): Invarianz durch relative statt absolute Häufigkeiten (real statt integer)

81 Feature-Aufbereitung Motivation Aufbereitung fehlende Minimalität hoher Speicherplatzverbrauch hoher Berechnungsaufwand ineffiziente Indexstrukturen (Fluch der hohen Dimensionen)

82 Feature-Aufbereitung (2) fehlende Orthogonalität Abhängigkeiten innerhalb Feature-Werte möglich Problem: keine Manipulation von Werten isoliert möglich schwere Realisierung etwa von Invarianzen

83 4.5 Eignung verschiedener Retrieval-Modelle 1.boolsches Modell 2.Fuzzy-Modell 3.Vektorraummodell klassische Retrieval-Modelle wurden für Text- Retrieval entwickelt

84 Boolesches Modell Eignung: basiert auf Mengentheorie und boolescher Algebra keine Unterstützung gradueller Ähnlichkeitswerte

85 Boolesches Modell (2) Semantik ist für viele Anwendungen zu scharf Negativbeispiel: Bildähnlichkeitssuche Vorteil: Konstruktion komplexer Anfragen mittels boolescher Junktoren

86 Fuzzy-Modell Eignung: Verallgemeinerung boolesches Modell um graduelle Zugehörigkeitswerte (Ähnlichkeitswerte) Junktoren auf Zugehörigkeitswerten ermöglichen Konstruktion komplexer Anfragen

87 Fuzzy-Modell (2) Import von Zugehörigkeitswerten (Ähnlichkeitswerten) aus Vektorraummodell ermöglicht Einbindung relationaler Anfragen Beispiel: Suche nach Gemälde von Caspar David Friedrich mit Abendstimmung

88 Vektorraummodell Eignung: Feature-Werte von Medienobjekten als geometrische Objekte im Vektorraum Verfahren der linearen Algebra für Retrieval einsetzbar

89 Vektorraummodell (2) gute Grundlage zur Ermittlung von Ähnlichkeitswerten viele Distanz- und Ähnlichkeitsfunktionen verfügbar

90 Multimedia-Ähnlichkeitsmodell viele Möglichkeiten zur Berechnung von Ähnlichkeitswerten hier vereinfachtes, verallgemeinertes Multimedia-Modell

91 Multimedia-Ähnlichkeitsmodell (2) Voraussetzungen: Feature-Werte gruppiert nach Feature und Extraktionsverfahren Ähnlichkeitswert (RSV für retrieval status value) pro Medienobjekt und Ähnlichkeitsanfrage ein Ähnlichkeitswert aus [0,1]

92 Multimedia-Ähnlichkeitsmodell (3) Voraussetzungen (Forts.): mehrere Feature-Gruppen: Anfrage mit mehreren Gruppen mehrere Anfrageobjekte z.b. aufgrund Nutzerprofil, positiv bewertete Objekte bei Anfrage-Iteration

93 Multimedia-Ähnlichkeitsmodell (4)