Inhaltsbasierte Bildsuche mit Farbhistogrammen

Ähnliche Dokumente
Proseminar "Aufgabenstellungen der Bildanalyse und Mustererkennung"

Ahnlichkeitsbestimmung von Bildern

BUILDINGS FROM IMAGES T H I E N P H A M G R U N D S E M I N A R W S 1 5 / 1 6 B E T R E U E R : P R O F. D R. P H I L I P P J E N K E

Histogramm-anschaulich. Histogramme und Bilder. Histogramm-mathematisch. Farbhistogramm. Grauwerthistogramm. Inhaltsbasierte Bildsuche Histogramme

Multimedia-Metadaten und ihre Anwendung

Recognizing Cars. André Justus. 7.Juni Louka Dlagnekov, Serge Belongie. Visuelle Überwachung Universität Bielefeld

Modellbasiertes Suchen von Objekten

Bilder. Bildsuchmaschiene. Bildsuche. Überblick. Beispiele im WWW. Inhaltsbasierte Bildsuche Motivation

Navigation anhand natürlicher Landmarken mit Hilfe der Scale Invariant Feature Transform. Thorsten Jost INF-M2 AW1 Sommersemester

Multimedia-Metadaten und ihre Anwendung

(query by image content)

Inhaltsbasierte Bildersuche

Betrachtung von Verfahren zur Posenbestimmung und Merkmalsexktraktion. Thorsten Jost INF-MA SR Wintersemester 2008/

Computer Vision: SVM-Anwendungsbeispiele, Generalisierbarkeit

Invariante Merkmale. Seminar Inhaltsbasierte Bildsuche 22. Dezember 2004 Marei Hopert

PCA based feature fusion

Superpixels for Skin Segmentation

Einleitung. Komplexe Anfragen. Suche ist teuer. VA-File Verfeinerungen. A0-Algo. GeVAS. Schluß. Folie 2. Einleitung. Suche ist teuer.

Human Detection Based On Part Models

Klassifikation durch direkten Vergleich (Matching)

Visuelle Bildsuche und Bildnavigation. Prof. Dr. Kai Uwe Barthel

Suche nach korrespondierenden Pixeln

Interaktive Lokalisierung durch Objekterkennung

The Earth Mover s Distance as a Metric for Image Retrieval

INTELLIGENTE DATENANALYSE IN MATLAB

Bild-Erkennung & -Interpretation

Inhaltsbasierte Bildsuche. Matthias Spiller. 17. Dezember 2004

Mod. 2 p. 1. Prof. Dr. Christoph Kleinn Institut für Waldinventur und Waldwachstum Arbeitsbereich Fernerkundung und Waldinventur

Analysis of Crash Simulation Data using Spectral Embedding with Histogram Distances

Content-Based Audio Management

Implizite Modellierung zur Objekterkennung in der Fernerkundung

Verwendung von merkmalsgestütztem Relevanz-Feedback zur Suche in einer Online-Bildergalerie

Ideen und Konzepte der Informatik. Maschinelles Lernen. Kurt Mehlhorn

Structure-from-Motion. Christina Mundhenk Leo Sylvio Rüdian Marcel Kliemannel

Gesichtserkennung mittels Deep Learning

1. Referenzpunkt Transformation

Neue Ansätze für Mustererkennung und automatisches Lernen

Softwareprojektpraktikum Maschinelle Übersetzung

Kapitel 31 Bild- und Tonretrieval. HHU Düsseldorf, WS 2008/09 Information Retrieval 483

Foundations of Image Formation and. Pattern Recognition

Vom Zeichen zur Schrift Mit Mustererkennung zur automatisierten Schreiberhanderkennung in mittelalterlichen und frühneuzeitlichen Handschriften

Computergrafik 2: Übung 2. Subsampling und Moiré-Effekte, Color Maps und Histogrammlinearisierung

Entwicklung einer robusten Methode zur Berechnung von Stereokorrespondenzen

compressed domain image retrieval

Textextraktion aus nichttextuellen Datenquellen

SIFT Flow Dense Correspondence across Different Scenes

Learning to Rank Sven Münnich

Softwareprojektpraktikum Maschinelle Übersetzung

Inpainting. Jane Dienemann Benjamin Vorwerk. Seminar Computational Photography Dozent: Prof. Dr.-Ing.Eisert Sommersemester 2010

Farbmomente. Christoph Sommer Seminar Inhaltsbasierte Bildsuche

2. Schnitterkennung Video - Inhaltsanalyse

Seminar: Maschinelles Lernen und Deep Learning

INTELLIGENTE DATENANALYSE IN MATLAB. Objekterkennung

Automatic segmentation for dental operation planning. Diplomarbeit. Nguyen The Duy

Einführung in die medizinische Bildverarbeitung WS 12/13

Bildregistrierung in der Medizin. Fethi KAYA - Yusuf ÖZBEK

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2

2. Schnitterkennung Videoanalyse

Softwareprojektpraktikum Maschinelle Übersetzung

Chapter 2 Image Similarity. Chapter 2 Image Similarity

Semantische Bildsuche mittels kollaborativer Filterung und visueller Navigation

Ist das Bild noch das Bild?

Evidenzpropagation in Bayes-Netzen und Markov-Netzen

Merkmalerkennung am Beispiel SIFT

Einführung in die medizinische Bildverarbeitung WS 12/13

Objekterkennung durch Vergleich von Farben. Videoanalyse Dr. Stephan Kopf HWS2007 Kapitel 5: Objekterkennung

Projekt Lesebrille : Mobiles Vorlesegerät für Blinde

Winter 2011/ Projekt kd- Trees. achsenparallelen Farbwürfel angeordnet. Die beiden schwarz- weiß- Ecken verbindet eine Graulinie.

Modulliste. für den Masterstudiengang. Data & Knowledge Engineering (alt) an der Otto von Guericke Universität Magdeburg Fakultät für Informatik

How To Create A Panorama Image From A Photoelectric Image From An Image From The Camera (I)

Beschleunigung von Bild-Segmentierungs- Algorithmen mit FPGAs

Aktuelle Forschungsgebiete der. Prof. Dr. Günter Rudolph Dipl.-Inform. Igor Vatolkin

Vorlesung Datenbanken II SS 2006

Softwareprojektpraktikum Maschinelle Übersetzung

Objekterkennung mit SIFT-Merkmalen

Seam Carving for Context-Aware Image Resizing

Kapitel 8. Inhaltsbasierte Suche in Bilddatenbanken

Untersuchung und Modellierung des Rolling-Shutter-Effekts für photogrammetrische Einzel- und Mehrbildauswertungen

Eigenfaces vs. Fisherfaces: Recognition Using Class Specific Linear Projection

Einführung in Support Vector Machines (SVMs)

Objekterkennung. David Pansch Robert Wieczoreck Seminar Intelligent Robotics Fachbereich Informatik Universität Hamburg

Ringvorlesung Bildverarbeitung

Titelmaster. Geodätische Woche. 3-D Phase Unwrapping Algorithmen zur Lösung der Phasenmehrdeutigkeiten in D-InSAR Stapeln

Shape Gradient for Image and Video Segmentation

Nachteile Boolesches Retrieval

Digitale Bildverarbeitung Einheit 10 Merkmalsextraktion

Teil IV Deskriptive Statistik

Digitale Bildverarbeitung Einheit 10 Merkmalsextraktion

Seminar Mustererkennung mit syntaktischen und graphbasierten Methoden Prof. Dr. W. Kurth / Th. Mangold Wintersemester 2006/2007

Entwicklung eines Distanzmaßes zwischen Bildern über dem Modell der Fields of Visual Words

6 Distanzfunktionen (2) 6 Distanzfunktionen. 6.1 Eigenschaften und Klassifikationen. Einführung

R.Wagner, Mathematik in der Astronomie

6 Distanzfunktionen. Quadratische Pseudo. 1. Eigenschaften und Klassifikation

Universität Innsbruck

CUDA Workshop. Ausblick. Daniel Tenbrinck

3. Analyse der Kamerabewegung Video - Inhaltsanalyse

Transkript:

Fakultät Informatik Fachrichtung Intelligente Systeme, Aufgabenstellungen der Bildanalyse und Mustererkennung Inhaltsbasierte Bildsuche mit Farbhistogrammen Dresden, 19.06.2009

Gliederung Grundlagen CBIR Histogramm Farbmodelle Euklidischer Abstand Kullback-Leibler divergence JSD Jensen Shannon Divergenz EMD Earth Mover's Distance Motivation Möglichkeiten Nutzen Beispiele Methoden gray value Histogram color Histogram Invariant Feature Histogram Tamura texture Histogram Garbor Features Local Feature Patches Histogram LF SIFT Histogramm MPEG 7: Edge Histogramm Ergebnisse gute vs. schlechte Methoden Kombination von Methoden Ausblick Referenzen Folie 2 von 25

Grundlagen CBIR Content Based Image Retrieval = Inhaltsbasierte Bildsuche Histogramm ist die graphische Darstellung der Häufigkeitsverteilung von Messwerten in BV: statistische Häufigkeit der Grauwerte bzw. der Farbwerte in einem Bild Aussage über die vorkommenden Grau- bzw. Farbwerte und über Kontrastumfang und Helligkeit des Bildes visualisiert die Verteilung der Helligkeitswerte ==> je höher der Balken über einem Farbwert ist, desto häufiger kommt dieser Farbwert im Bild vor Folie 3 von 25

Grundlagen Histogramm wenn man sinnvolle Spezifikationsgrenzen für einen Prozess definieren möchte wenn man den tatsächlichen Verlauf der Häufigkeitsverteilung sehen möchte und nicht nur Einzeldaten (Mittelwert, Standardabweichung) Folie 4 von 25

Grundlagen Farbmodelle RGB Lab L.. Helligkeit a.. Grün/Rot - b.. Blau/Gelb besonders zur Beschreibung von nichtleuchtenden Farben (Körperfarben) verwendet Folie 5 von 25

Grundlagen Euklidischer Abstand Abstand zwischen zwei Punkten Kullback-Leibler Divergenz Maß für die Unterschiedlichkeit zweier Wahrscheinlichkeitsverteilungen auch relative Entropie genannt Wahrscheinlichkeitsfunktionen P und Q Jensen Shannon Divergenz Maß für die Ähnlichkeit zweier Wahrscheinlichkeitsverteilungen auch Infomationsradius genannt symmetrische und geglättete Version der KL-Divergenz Folie 6 von 25

Grundlagen Earth Movers Distance (EMD) auch Wassterstein-Metrik oder Mallow-Distanz genannt für 2 normierte Wahrscheinlichkeitsverteilungen Transportproblem mit linearer Optimierung Minimum an Arbeit um bestimmte Menge an Erdhaufen in Erdlöcher mit unterschiedlicher Kapazität zu verteilen Folie 7 von 25

Motivation persönliche Fotosammlung durchsuchen und sortieren öffentliche Bilddatenbanken Gebäudeerkennung -> mobile, interaktive Touristenführer medizinische Besipieldatenbanken journalistische Bildersuche Folie 8 von 25

Motivation... Klassifizierung der Bilder Maschinenlesbare Beschreibung der Bilder notwendig aktuelle Stand der Forschung: FIRE (rwth-aachen) Airliners.net riya.com similar-images-google ALIPR Folie 9 von 25

Methoden Grauwerthistogramm (gray value histogram) Histogramm über den Grauwert eines Bildes -> Häufigkeitsverteilung der Grauwerte Aussagen über Kontrastumfang und Helligkeit Folie 10 von 25

Methoden Farbwerthistogramm (color histogram) meist Grundlage für weitere Analysen Frequenzen der auftauchenden Farben robust gegen Blickwinkeländerungen Vergleiche der Histogramme mit JSD H, H' zu vergleichende Histogramme Hm m-te Bin von H Folie 11 von 25

Methoden M, N.. maximale Bildkoordinaten g.. Elemente der Transformationsgruppe G (Rotation, Translation) Invariant Feature Histogram robust gegen Transformationen (Translation, Rotation, Skallierung) Konstruktion der invarianten Features: Integration über die Gruppe der Transformationen oder annähern durch Aufsummierung Vergleiche der Histogramme mit JSD Folie 12 von 25

Methoden Tamura texture histogram ausgehend von der menschlichen Wahrnehmung coarseness, contrast, direktionality (Grobehit, Kontrast, Richtung) besonders Beachtung geschenkt Berechnung der Gradienten der Pixel Quantisieren der errechneten Winkel Schärfegrad- Histogramm mit den zugehörigen Pixelpositionen erstellen Folie 13 von 25

Methoden Gabor Features Ebenfalls zur Texturanalyse Durchschnitt und Standartabweichung in 5 verschiedenen Richungen und Skallierungen mit Hilfe des Gabor-Filter extrahiert oder 12 verschiedene kreisrunde Gabor-Filter auf das Bild anwenden Histogramme aus den Filterausgaben berechnen Histogrammvergleich mit JSD Folie 14 von 25

Methoden Local Image Feature Patches Histogram patches = Stellen sind besondere extrahierte Gebiete des Bildes 2048 Cluster bilden (patches mit PCA reduzieren) je Feature wird nur der Cluster mit dem ähnlichsten Zentrum gespeichert pro Bild Histogramm mit allen auftretenden patch-cluster-identifiers erstellen (wieviele extrahierte patches gehören zu jedem Cluster) Ergebniss: 2048 dimensionales Histogramm für jedes Bild Vergleich mit Jeffrey-Divergenz Patches extrahiert von besonderen Stellen bzw. im uniformen Gitter Folie 15 von 25

Methoden Local Image Feature SIFT Histogram Features aus dem Bild extrahiert pro Bild 32 Cluster gebildet Parameter der Cluster (Bsp. Durchschnitt, Varianz) gespeichert Cluster-Identifier im Histogramm dargestellt mit EMD vergleichen Folie 16 von 25

Methoden MPEG 7: Edge Histogram repräsentiert räumliche Verteilung von 5 verschiedenen Kantentypen (4 gerichtete und eine ungerichtete Kantenart) robust gegen Skallierung Bild in 4x4 Subimages unterteilen Kantenverteilung der 5 verschiedenn Kantenarten pro Subimage berechnen 5 x 16 = 80 Bins je Histogramm Folie 17 von 25

Ergebnisse Testdatenbanken WANG: 1000 Bilder 10 Klassen 100 Bilder je Klasse UW: 1109 Bilder 18 Klassen mit 352 Schlüsselwörtern Folie 18 von 25

Ergebnisse Testdatenbanken IRMA: 10000 Bilder 1000 Suchbilder 57 Klassen Schlüsselwörter ZuBud: 1005 Bilder 201 verschiedene Gebäude 115 Suchbilder Folie 19 von 25

Ergebnisse Testdatenbanken UCID: 1338 Bilder bei 264 Bildern Relevanz zu den restlichen festgelegt 262 Suchbilder Folie 20 von 25

Ergebnisse gute vs. schlechte Methoden Fehlerrate Trefferrate in % irma in % zubud 80,0 80,0 60,0 60,0 40,0 w ang 40,0 uw 20,0 irma w ang ucid 0,0 zubud ucid 0,0 color histogram LF patches histogram LF SIFT histogram invariant feature histogram gabor features tamura texture histogram gray value histogram color histogram LF SIFT histogram invariant feature histogram LF patches histogram gabor features MPEG 7: edge histogram tamura texture histogram gray value histogram 100,0 20,0 Folie 21 von 25 uw 100,0

Ergebnisse Kombination von Methoden...an der WANG-Beispieldatenbank sinkende Fehlerrate steigende Trefferrate feature Fehlerrate [%] Trefferrate [%] color histogram 16,9 50,5 + global texture 15,7 49,5 + tamura texture histogram 13,7 51,2 + thumnails 13,7 53,9 + LF patch histogram 11,6 55,7 1: color histogram, 2: MPEG7: color layout, 3: LF SIFT histogram, 4: LF SIFT signature, 5: LF SIFT global search, 6: MPEG7: edge histogram, 7: Gabor vector, 8: Gabor histograms, 9: gray value histogram, 10: global texture feature, 11: inv. feature histogram (monomial), 12: LF patches global, 13: LF patches histogram, 14: LF patches signature, 15: inv. feature histogram (relational), 16: MPEG7: scalable color, 17: Tamura texture histogram, 18: 32x32 image, 19: Xx32 image Folie 22 von 25

Ausblick Forschung wird sich auf das Finden neuer besserer Bildbeschreiber (Descriptoren oder Signaturen) konzentrieren Entwickelung von Methoden diese besser zu kombinieren Objekterkennung verbessern bzw. in die CBIR besser einbinden automatisches Maschinenlernen weiterentwickeln automatische Generierung von Textlabels... Folie 23 von 25

Referenzen Thomas Deselaers, Daniel Keysers, Hermann Ney; Features for Image Retrieval: An Experimental Comparison; German Research Center for Artificial Intelligence (DFKI), Kaiserslautern, Germany; 2007 Smeulders A W M, Worring M, Santini S, Gupta A, Jain R.; Content-Based Image Retrieval at the End of the Early Years; IEEE Transactions on Pattern Analysis and Machine Intelligence; 2000 Siggelkow S.; Feature Histograms for Content-Based Image Retrieval; Ph.D. thesis; University of Freiburg, Institute for Computer Science, Freiburg, Germany; 2002 Lokesh Setia, Julia Ick, Hans Burkhardt; SVM-based Relevance Feedback in Image Retrieval using Invariant Feature Histograms; Institute of Computer Science Albert-Ludwigs-University Freiburg 79110 Freiburg im Breisgau, Germany; 2005 S. Kulkarni1 and B. Verma; Fuzzy Logic based Texture Queries for CBIR; Department of Computer Science and Mathematics Nipissing University, North Bay, Canada; School of Information Technology Griffith University, Gold Coast Campus, Australia; 2003 Xing-Jian He, Yue Zhang, Tat-Ming Lok, Michael R. Lyu; A New Feature of Uniformity of Image Texture Directions Coinciding with the Human Eyes Perception; Intelligent Computing Lab, Institute of Intelligent Machines, Chinese Academy of Sciences, Hefei, Anhui 230031, China; Information Engineering Dept., The Chinese University of Hong Kong, Shatin, Hong Kong; Computer Science & Engineering Dept., The Chinese University of Hong Kong, Shatin, Hong Kong; 2005 Peng Yang, Shiguang Shan, Wen Gao, Stan Z. Li, Dong Zhang; Face Recognition Using Ada-Boosted Gabor Features; Institute of Computing Technology of Chinese Academy Science; Microsoft Research Asia Deselaers T, Keysers D, Ney H. Discriminative Training for Object Recognition using Image Patches. In: IEEE Conference on Computer Vision and Pattern Recognition (CVPR 05). vol. 2. San Diego, CA; 2005 David G. Lowe; Object Recognition from Local Scale-Invariant Features; Computer Science Department University of British Columbia, Vancouver, B.C., V6T 1Z4, Canada Chee Sun Won, Dong Kwon Park, Soo-Jun Park; Efficient Use of MPEG-7 Edge Histogram Descriptor; ETRI Journal, Volume 24, Number 1, February 2002 Folie 24 von 25

Folie 25 von 25