Inhaltsbasierte Bildersuche

Ähnliche Dokumente
Bildkompression am Beispiel JPEG

(query by image content)

Übungen zu Multimedia-Datenbanken Aufgabenblatt 4 - Musterlösungen

T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente.

Merkmalerkennung am Beispiel SIFT

entspricht der Länge des Vektorpfeils. Im R 2 : x =

Objekterkennung durch Vergleich von Farben. Videoanalyse Dr. Stephan Kopf HWS2007 Kapitel 5: Objekterkennung

Lineare Algebra. Mathematik II für Chemiker. Daniel Gerth

Computergrafik 2: Übung 2. Subsampling und Moiré-Effekte, Color Maps und Histogrammlinearisierung

Semantische Bildsuche mittels kollaborativer Filterung und visueller Navigation

Objekterkennung am Beispiel des Viola-Jones-Objektdetektors

Skalarprodukt, Norm & Metrik

Grundlagen der Vektorrechnung

LMU München LFE Medieninformatik Mensch-Maschine Interaktion (Prof. Dr. Florian Alt) SS2016. Mensch-Maschine-Interaktion

Farbe in der Computergraphik

Farbmodelle. MBV5 Werner Backfrieder FH-Hagenberg. Spektrale Zerlegung der sichtbaren Lichtes

9. Vorlesung Lineare Algebra, SVD und LSI

Projektionen für f r die Scanregistrierung mit Hilfe von Bildmerkmalen

Universität Innsbruck

Distributed Algorithms. Image and Video Processing

b) Bestimmen Sie die bedingten relativen Häufigkeiten mit dem Merkmal Abschluss als Bedingung.

Analysis of Crash Simulation Data using Spectral Embedding with Histogram Distances

Kapitel 1. Vektoren und Matrizen. 1.1 Vektoren

Butz, Krüger: Mensch-Maschine-Interaktion, Kapitel 2 - Wahrnehmung. Mensch-Maschine-Interaktion

Prof. H. Mixdorff Farbmetrik und IBK-Farbdiagramm

Internationaler Studiengang Medieninformatik

Zu hell oder zu dunkel? Histogramm im ueye Cockpit nutzen

Definition: Euklidischer Raum mit Skalarprodukt. Die kanonische Basis von Einheitsvektoren sind paarweise orthogonal zueinander:

Lineare Algebra und analytische Geometrie II

Inpainting. Jane Dienemann Benjamin Vorwerk. Seminar Computational Photography Dozent: Prof. Dr.-Ing.Eisert Sommersemester 2010

Maschinelles Lernen: Symbolische Ansätze. Wintersemester 2013/2014 Musterlösung für das 7. Übungsblatt

Die Welt der Shader. Fortgeschrittene Techniken III

Multimedia-Datenbanken im SS 2010 Einführung in MMDB

Teil 6: Farbe. Einleitung. Farbreiz vs. Farbwahrnehmung. Farbräume, Verwendung von Farbe

2. Vorlesung Wintersemester

1.2.1 Analoges Speichern auf Vinyl Erläutern Sie die prinzipielle Funktionsweise von Langspielplatten bzw. Plattenspielern.

1 Einleitung Definitionen, Begriffe Grundsätzliche Vorgehensweise... 3

Proseminar Multimedia Datenbanken und Retrieval QBIC

Anwendungen der Hauptkomponentenanalyse. Volker Tresp vertreten durch Florian Steinke

Kurzskript zur Vorlesung Mathematik I für MB, WI/MB und andere Prof. Dr. Ulrich Reif

2. Schnitterkennung Videoanalyse

12 Fakten über industrielle Farbprüfung

Inhaltsbasierte Bildsuche mit Farbhistogrammen

Das Skalarprodukt zweier Vektoren

Boole'sches Modell <is web>

Kapitel 8. Inhaltsbasierte Suche in Bilddatenbanken

1. Vektoralgebra 1.0 Einführung Vektoren Ein Vektor ist eine Größe, welche sowohl einen Zahlenwert (Betrag) als auch eine Richtung hat.

2. Dezember Lineare Algebra II. Christian Ebert & Fritz Hamm. Skalarprodukt, Norm, Metrik. Matrizen. Lineare Abbildungen

2D Graphik: Bildverbesserung. Vorlesung 2D Graphik Andreas Butz, Otmar Hilliges Freitag, 2. Dezember 2005

Einleitung Grundlagen Einordnung. Normen. Thomas Gerstner. Institut für Mathematik Goethe-Universität Frankfurt am Main

Bildverarbeitung Herbstsemester. Mustererkennung

Laden von Daten: Über Open Single File Dataset OK kann ein Datensatz in LEOWorks geladen werden.

Vektoren und Matrizen

Farbtiefe. Gängige Farbtiefen

Digitale Medien. Übung

Multimedia Retrieval. Warum Multimedia Retrieval? Image Retrieval Video Retrieval Audio/ Musik Retrieval. Fakten. Image Retrieval

Kapitel 6. Metrik, Norm und Skalarproduktl. 6.1 Metrik (Abstand)

L3 Euklidische Geometrie: Längen, Winkel, senkrechte Vektoren...

Stereo-Matching. Medieninformatik IL. Andreas Unterweger. Vertiefung Medieninformatik Studiengang ITS FH Salzburg. Wintersemester 2014/15

Numerisches Rechnen. (für Informatiker) M. Grepl P. Esser & G. Welper & L. Zhang. Institut für Geometrie und Praktische Mathematik RWTH Aachen

Betrachtung von Verfahren zur Posenbestimmung und Merkmalsexktraktion. Thorsten Jost INF-MA SR Wintersemester 2008/

Digitale Bilder. Ein Referat von Jacqueline Schäfer und Lea Pohl Am

Definition von R n. Parallelverschiebungen in R n. Definition 8.1 Unter dem Raum R n (n N) versteht man das kartesische Produkt R R... R (n-mal), d.h.

Übungsblatt 5 : Lineare Algebra

Multimediatechnik / Video

Lineare Algebra und Numerische Mathematik für D-BAUG

& sind die Vektorkomponenten von und sind die Vektorkoordinaten von. A x. a) Der Betrag eines Vektors

... Text Clustern. Clustern. Einführung Clustern. Einführung Clustern

L3 Euklidische Geometrie: Längen, Winkel, senkrechte Vektoren...

Grundlagen der Bildverarbeitung: Übung 1

6. Übungsblatt Aufgaben mit Lösungen

Vektor-Multiplikation Vektor- Multiplikation

Übung zu Einführung in die Informatik # 14

Vektoren, Vektorräume

Vorkurs: Mathematik für Informatiker

Drehung. Die orthogonale n n-matrix 1 0. c s. Zeile j. s c

Ebenen in Normalenform

Ideen und Konzepte der Informatik. Maschinelles Lernen. Kurt Mehlhorn

. Name motiviert durch (hängt von Einbettung in höher dimensionalen Raum ab) folgendes Bild:

Angewandte Informatik: Lehrstuhl Medieninformatik

Teil 7: Beleuchtung Beleuchtungsmodelle, Schattierungsmodelle

HDR-Aufnahmetechnik mit Raw-Workflow

Transkript:

Inhaltsbasierte Bildersuche Medieninformatik IL Andreas Unterweger Vertiefung Medieninformatik Studiengang ITS FH Salzburg Wintersemester 2014/15 Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 1 / 20

Definition Inhaltsbasierte Bildersuche Engl. Content-based image retrieval (CBIR) Finden von Bildern anhand von Bildmerkmalen Farben und deren Verteilung Formen und deren Verteilung Merkmalvektoren (z.b. von SIFT)... Quelle: Rorissa, A.: Image Retrieval Benchmarking Visual Information Indexing and Retrieval Systems. http://www.asis.org/bulletin/feb-07/rorissa.html (4.10.2014), 2007. Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 2 / 20

Motivation und Anwendungen Motivation: Weitestgehende Vermeidung manueller Metadatenpflege (z.b. durch Tagging), da Zeitaufwändig Kaum automatisierbar Umfangsbeschränkt (z.b. konsistente Farbsortierung kaum möglich) Hauptanwendung: Ähnlichkeitssuche (engl. Reverse Image Search bzw. Query by Example) Finden von Bildern mit ähnlichen Farben/Motiven/... Duplikaterkennung Plagiaterkennung Manipulationserkennung Andere Anwendungen (Auswahl): Semantische Suche (Finden bestimmter Motive) Zensur (Hauterkennung u.ä.) Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 3 / 20

Softwarebeispiele (Auswahl) Google Bildersuche (https://www.google.at/imghp) TinEye (http://tineye.com/) pixolution (http://demo.pixolution.de/) The GNU Image-Finding Tool (http://www.gnu.org/software/gift/) Übersichtsliste: http://en.wikipedia.org/wiki/list_of_cbir_engines Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 4 / 20

Überlick zu CBIR Merkmaltaxonomie nach 1 Low-level: Aus Pixeldaten Mid-level: Aus segmentierten Daten High-level: Semantische Daten (Kategorien, Zusammenhänge etc.) Semantic Gap: Mensch sucht high-level, Maschine arbeitet low-level Ausgewählte Bildmerkmale Durchschnittsfarbe(n) SIFT-Merkmalvektoren Farbverteilung Ausgewählte Vergleichsmetriken Vektordistanz Histogrammdistanz 1 Marques, O. und Furht, B.: Content-Based Image and Video Retrieval. Kluwer Academic Publishers, 2002. Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 5 / 20

Wiederholung: Menschliche Farbwahrnehmung Farbreiz aus Rot-, Grün- und Blau-Komponenten (RGB) Drei Arten von Zapfen auf Netzhaut Farbwahrnehmung Andere Farbräume zur Berücksichtigung der weiteren Verarbeitung Quellen: Roorda, A. und Williams, D.: The arrangement of the three cone classes in the living human eye. Nature, 397(6719):520-522, 1999; http://commons.wikimedia.org/wiki/file:cone-response.svg Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 6 / 20

Durchschnittsfarbe(n) I Ausgangspunkt: m n Pixel großes RGB-Bild I (x, y) = Berechnung: Mittelwert jedes Farbkanals: I R = 1 m n I G = 1 m n I B = 1 m n m y=1 x=1 m y=1 x=1 m y=1 x=1 n I R (x, y) n I G (x, y) n I B (x, y) I = I R I G I B I R (x, y) I G (x, y) I B (x, y) Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 7 / 20

Durchschnittsfarbe(n) II I = 1 m n I = m y=1 x=1 I R I G I B n I (x, y) Vorteile: Einfach zu berechnen Schnell zu berechnen Nachteile: Helligkeitsabhängig Kaum diskriminativ (unähnliche Bilder liefern ähnlichen Durchschnitt) Nicht repräsentativ (rot-blaues Muster gleicht lila Fläche) Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 8 / 20

Durchschnittsfarbe(n) III Helligkeitsabhängigkeit durch Normierung (Einheitsvektor) entfernen Richtung (Farbkomponentenaufteilung) bleibt erhalten, Länge wird 1 I e = I I = I 2 2 2 I R + IG + IB Quellen: Otto, G.: Organizing Color. http://viz.aset.psu.edu/gho/sem_notes/color_2d/html/primary_systems.html (4.10.2014), 2000; Cattin, P.: Digital Image Fundamentals Introduction to Signal and Image Processing. https://miac.unibas.ch/sip/02-fundamentals.html (4.10.2014), 2014. Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 9 / 20

Vektorabstand I Abstand zwischen zwei Vektoren v 1 und v 2 bestimmen Typisches Maß: Norm des Differenzvektors v diff = v 2 v 1 y v 1 y v diff x v 2 x v diff Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 10 / 20

Vektorabstand II p-norm im R n für einen Vektor v = ( v 1 v 2... ) T v n : ( n ) 1 p v p = v i p Praktisch relevanter Spezialfall 2-Norm (euklidische Norm): v 2 = n i=1 i=1 Praktisch relevanter Spezialfall 1-Norm (Summennorm): n v 1 = v i i=1 v 2 i Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 11 / 20

Vektorabstand III Summennorm wird auch als Manhattan-Distanz bezeichnet: Quelle: Harmony Institute: Comparing the moral language of television to that of its viewers. http://harmony-institute.org/ therippleeffect/2013/06/26/comparing-the-moral-language-of-television-to-that-of-its-viewers/ (4.10.2014), 2013. Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 12 / 20

Vektorabstand IV Vektorabstand auch für Merkmalvektoren ( v 1, v 2 R n ) berechenbar Beispiel SIFT: Schlüsselpunktdeskriptoren sind 128-dimensionale Merkmalvektoren ( v 1, v 2 R 128 ) Norm des Differenzvektors ergibt Abstand Abstände von nicht normierten Vektoren sind oft problematisch Stärkere Gewichtung des längeren Vektors Kurze Vektoren in entgegengesetzte Richtungen haben kurze Abstände Winkel zwischen Vektoren als alternatives Ähnlichkeitsmaß ( ) v1 v 2 ϕ = arccos v 1 v 2 Anmerkung: bezeichnet im Zähler das (innere) Vektorprodukt Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 13 / 20

Farbverteilung I Farbverteilung über Histogramme jedes Farbkanals ermittelbar Histogramm: Häufigkeit von Farbwerten oder Farbwertgruppen Adaptiert von: Gemma, R. M.: Image histogram. http://technlg.wordpress.com/2014/01/23/image-histogram/ (4.10.2014), 2014. Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 14 / 20

Farbverteilung II Gruppierung von Farbwerten durch (Vektor-)Quantisierung Quelle: Cloud N Sci Ltd: RGB Heatmap Demo. http://cloudnsci.fi/wiki/index.php?n=heatminer.rgbheatmapdemo (4.10.2014), 2013. Normierung sinnvoll Verwendung anderer Farbräume möglich Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 15 / 20

Farbverteilung III Quantisierungseffekte: Quelle: Ji, J.: Chapter 2. Image Structure http://jun.hansung.ac.kr/di/chapter-2.htm (4.10.2014), 2014. Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 16 / 20

Histogrammdistanzen Vergleich von Histogrammen durch Histogrammdistanz (entweder pro Farbkanal separat oder durch zusammengefügte Histogramme) Verschiedene Metriken zur Distanzbestimmung (Auswahl): Minkowski-Distanz (p-norm) Kreuzkorrelation Earth Mover s Distance (EMD) Minowski-Distanz d p für Histogramme H 1 und H 2 mit je N Partitionen (Partitionsmenge P, P = N, H i : P [0; 1] R): H diff p = H 2 (p ) H 1 (p ) p p P 1 p = ( N i=1 H 2i H 1i p ) 1 p Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 17 / 20

Earth Mover s Distance I Idee: Histogramme repräsentieren Gelände (Häufigkeit jeder Partition entspricht Höhe eines Erdhügels N Erdhügel) Frage: Wie viel Arbeit ist (minimal) notwendig, um mit einer Schürfraupe das erste Gelände in das zweite umzuformen? Ziel: Aufwand für Umformarbeiten entspricht Histogrammdistanz Voraussetzung: Histogramme sind normiert ( gleich viel Erde ) Quelle: Čonos, M.: Earth Mover s Distance EMD. http://vellum.cz/~mikc/oss-projects/carrecognition/doc/dp/node29.html (4.10.2014) 2007. Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 18 / 20

Earth Mover s Distance II Definition Arbeit: Verschobene Menge f mal Entfernung d zwischen Partitionen mit Indizes i und j: W ij = f ij d ij Arbeit für alle Verschiebungen (soll durch f ij -Wahl minimiert werden): N N N N W = W ij = f ij d ij i=1 j=1 i=1 j=1 EMD als Metrik: Normierung der Arbeit durch verschobene Menge F : N N f ij d ij EMD(H 1, H 2 ) = W F = i=1 j=1 N N f ij i=1 j=1 Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 19 / 20

Danke für die Aufmerksamkeit! Fragen? Andreas Unterweger (FH Salzburg) Inhaltsbasierte Bildersuche Wintersemester 2014/15 20 / 20