Computergrafik 2: Objekt-/Bilderkennung



Ähnliche Dokumente
Computergrafik 2: Objekt-/Bilderkennung

Betrachtung von Verfahren zur Posenbestimmung und Merkmalsexktraktion. Thorsten Jost INF-MA SR Wintersemester 2008/

MMI2 Übung 10: Kamera-basierte mobile Interaktion. Prof. Dr. Michael Rohs, Dipl.-Inform. Sven Kratz MHCI Lab, LMU München

Human Detection Based On Part Models

Bildmerkmalssuche. Seminar Computational Photography. Visual Computing Department of Computer Science

Interaktive Lokalisierung durch Objekterkennung

Navigation anhand natürlicher Landmarken mit Hilfe der Scale Invariant Feature Transform. Thorsten Jost INF-M2 AW1 Sommersemester

Merkmalerkennung am Beispiel SIFT

Elementare Bildverarbeitungsoperationen

Bildverarbeitung Herbstsemester Kanten und Ecken

Proseminar "Aufgabenstellungen der Bildanalyse und Mustererkennung"

Data-S EASY VERSTREUTE ÜBERWACHUNG DER NOTBELEUCHTUNG

Objekterkennung mit SIFT-Merkmalen

Suche nach korrespondierenden Pixeln

ANALYTISCHE CHEMIE I. Trennmethoden. 1. Grundlagen Chromatographie WS 2004/2005

(query by image content)

Implementierung und Evaluierung von Video Feature Tracking auf moderner Grafik Hardware

Computer-Graphik I Transformationen & Viewing

Scene Reconstruction with Multiple View Geometry

Kybernetik Intelligent Agents- Action Selection

Einführung in die Robotik Kinematik. Mohamed Oubbati Institut für Neuroinformatik. Tel.: (+49) 731 / mohamed.oubbati@uni-ulm.de

Industrielle Bildverarbeitung mit OpenCV

a) Name and draw three typical input signals used in control technique.

Modellbasiertes Suchen von Objekten

Der Wetterbericht für Deutschland. Read the weather reports and draw the correct weather symbols for each town.

Anwendung einer Monokularen Kamera als Bewegungs-Sensor für Mobile Roboter p.1

Untersuchung der Zusammenhänge zwischen der gebauten Struktur einer Stadt und der

ORM & OLAP. Object-oriented Enterprise Application Programming Model for In-Memory Databases. Sebastian Oergel

Video Line Array Highest Resolution CCTV

Landmarkenbasierte Kartierung und Lokalisierung

Getting Started General Workflow. Anlegen von Schablonen Ausrichtung 3.2. Atoms Precision V2 Tutorial. Working with Images Direct from Camera

DPF Dynamic Partial distance Function

Inverse Problems In Medical Imaging

Computer Vision I. Nikos Canterakis. Lehrstuhl für Mustererkennung, Universität Freiburg

3. Analyse der Kamerabewegung Video - Inhaltsanalyse

Bildverarbeitung Herbstsemester. Binärbildanalyse

Priorities (time independent and time dependent) Different service times of different classes at Type-1 nodes -

Computer Vision: AdaBoost. D. Schlesinger () Computer Vision: AdaBoost 1 / 10

Fuzzy Logic. Seminar im Sommersemester 2006 an der TU-Darmstadt (Prof. Dr. Fürnkranz) 06/18/06 Knowledge Engineering in Computer Spielen 1

Sie finden auf den folgenden Seiten die Bewertungsrichtlinien für alle freigegebenen TIMSS 2007 Aufgaben mit offenem Antwortformat.

Integration geometrischer und fotogrammetrischer Information zum Wiederfinden von Bildern

Objekterkennung mit OpenCV

Filter Transformationen (Blender) INSTITUTE OF COMPUTER GRAPHICS AND ALGORITHMS

Tuning des Weblogic /Oracle Fusion Middleware 11g. Jan-Peter Timmermann Principal Consultant PITSS

Suche in Spielbäumen Spielbäume Minimax Algorithmus Alpha-Beta Suche. Suche in Spielbäumen. KI SS2011: Suche in Spielbäumen 1/20

Geometrie und Bedeutung: Kap 5

Vorstellung RWTH Gründerzentrum

Super-Resolution. Irena Kpogbezan & Moritz Brettschneider. Seminar Computational Photography

Segmentierung von Faserstrukturen in tomographischen Aufnahmen. Workshop Analyse der Mikrostruktur von Faserverbundwerkstoffen in Volumenbildern

Where are we now? The administration building M 3. Voransicht

Im Jahr t = 0 hat eine Stadt Einwohner. Nach 15 Jahren hat sich die Einwohnerzahl verdoppelt. z(t) = at + b

EU nimmt neues Programm Mehr Sicherheit im Internet in Höhe von 55 Millionen für mehr Sicherheit für Kinder im Internet an

Produktvielfalt Variety of Products

Titelbild1 ANSYS. Customer Portal LogIn

Software in der Industriellen Bildverarbeitung

Softwareprojekt Spieleentwicklung

"What's in the news? - or: why Angela Merkel is not significant

job and career for women 2015

Erinnerung. Arbeitsschritte der Computergraphik. Modellierung. Animation. Rendering. Ausgabemedium. Generierung

Algorithms & Datastructures Midterm Test 1

1.1 VoIP - Kein Notruf möglich. 1.2 VoIP - Vorrang von Notrufen

CABLE TESTER. Manual DN-14003

Robuste Hashes zur forensischen Bilderkennung

SemTalk Services. SemTalk UserMeeting

Clustering Seminar für Statistik

Kamerabasierte Navigation im Inneren von Gebäuden Sebastian Hilsenbeck, Robert Huitl, Georg Schroth, Eckehard Steinbach

MMI 2: Mobile Human- Computer Interaction Übung 3

Unternehmen-IT sicher in der Public Cloud

Live Streaming => Netzwerk ( Streaming Server )

Aufnahmeuntersuchung für Koi

Dynamisches SQL. Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München

Auszug aus der netzbetriebenen Multimotor-Serie

Einkommensaufbau mit FFI:

Grundlagen der Rekonstruktion bei bildgebenden 3D-Schichtverfahren

IT-Forum Darmstadt 16. Mai 2008

Introduction FEM, 1D-Example

Übungsaufgaben. Aufgabe 1 Internetsuchmaschinen. Einführung in das Information Retrieval, 8. Mai 2008 Veranstaltung für die Berufsakademie Karlsruhe

Context-adaptation based on Ontologies and Spreading Activation

Bildverarbeitung in der Qualitätskontrolle. Sebastian Zambal LEADING INNOVATIONS

Rekonstruktion 3D-Datensätze

Algorithmen und Datenstrukturen Bereichsbäume

Grundform 1 (Abb. 1) ist die Anfangsposition für alle Figuren. Die weiteren Schritte für Karo 1, 2, und 3 haben wir in der letzten ZauberSalz gesehen.

Preisliste für The Unscrambler X

Entwurf und Erkennung von codierten Zielmarken

Wörterbücher von MS nach Ooo konvertieren

Anmerkungen zur Übergangsprüfung

Stereo Vision. Projekt zur 3D Computer Vision Wintersemester 05/06

Fundamentale Matrix: 8-Punkte Algorithmus

Transkript:

Computergrafik 2: Objekt-/Bilderkennung Prof. Dr. Michael Rohs, Dipl.-Inform. Sven Kratz michael.rohs@ifi.lmu.de MHCI Lab, LMU München Folien teilweise von Andreas Butz, sowie von Klaus D. Tönnies (Grundlagen der Bildverarbeitung. Pearson Studium, 2005)

Themen heute Objekt-/Bilderkennung Lokale Merkmale Skalenraum Scale Invariant Feature Transform (SIFT) Computergrafik 2 SS2011 2

OBJEKT-/BILDERKENNUNG MIT LOKALEN MERKMALEN Computergrafik 2 SS2011 3

Objekt-/Bilderkennung Identifikation von Objekten, Szenen, Teilbildern und Bestimmung von Parametern (Position, Größe, Orientierung, etc.) Bildregistrierung: Transformation berechnen, um zwei Bilder der selben Szene in Übereinstimmung bringen unbekannte Perspektivenänderung der Kamera Anwendungen Visuelle Suche: Finden ähnlicher Bilder zu einem Anfragebild Automatisierung und Qualitätskontrolle in der Industrie Mobile Roboter, Spielzeuge, Benutzungsschnittstellen Lokalisierung Panoramabilder Augmented Reality Computergrafik 2 SS2011 4

Objekt-/Bilderkennung durch lokale Merkmale Charakteristische Orte im Bild ( interest points ) charakteristisch, unverwechselbar, hoher Informationsgehalt stabil lokalisierbar robust gegenüber Veränderung der Perspektive, Helligkeit, etc. ( ) lokaler Deskriptor lokale Deskriptoren, Merkmalsvektoren beschreiben / repräsentieren charakteristische Orte im Bild robust / invariant gegenüber Veränderung der Perspektive, Helligkeit, Translation / Rotation / Skalierung, etc. effizient berechenbar Vorteil: teilweise Verdeckung unproblematisch Bildquelle: Schmid, Mohr: Local Grayvalue Invariants for Image Retrieval. PAMI, 19(5):530-534, 1997. Computergrafik 2 SS2011 5

Objekt-/Bilderkennung durch lokale Merkmale Finden von ähnlichen Bildern 1. Charakteristische Orte extrahieren (z.b. Harris Corner-Detektor) 2. lokale Deskriptoren berechnen 3. korrespondierende Deskriptoren in anderen Bildern finden 4. Bild mit den meisten Treffern auswählen à Korrektheit? Bildquelle: Schmid, Mohr: Local Grayvalue Invariants for Image Retrieval. PAMI, 19(5):530-534, 1997. Computergrafik 2 SS2011 6

Zhang et al. 1994: Matching Corners Bildregistrierung mit Hilfe lokaler Merkmale Bildregistrierung: Transformation berechnen, um zwei Bilder der selben Szene in Übereinstimmung bringen unbekannte Perspektivenänderung der Kamera Finden von korrespondierenden Punkten in den Bildern Harris Corner-Detektor Template-Matching durch Korrelation an den Ecken Bildquelle: Zhang, Deriche, Faugeras, Luong: A Robust Technique for Matching Two Uncalibrated Images Through the Recovery of the Unknown Epipolar Geometry. Technical Report, INRIA, 1994. Computergrafik 2 SS2011 7

Zhang et al. 1994: Matching Corners Template-Matching: Skalierung? Rotation? Bildquelle: Zhang, Deriche, Faugeras, Luong: A Robust Technique for Matching Two Uncalibrated Images Through the Recovery of the Unknown Epipolar Geometry. Technical Report, INRIA, 1994. Computergrafik 2 SS2011 8

Schmid & Mohr 1997: Rotationsinvarianz Finden von korrespondierenden Punkten in den Bildern Harris Corner-Detektor Rotationsinvariante Merkmale (Kombinationen von Gaußableitungen, z.b. quadrierte Gradientenlänge, Laplace-Operator) Rotationsinvarianz, eingeschränkte Skalierungsinvarianz Voting zum Finden des ähnlichsten Bildes Bilder in Datenbank nummeriert 1..k Merkmal j für Bild i in Datenbank gespeichert als (m ij,i) Für alle Merkmale m qx im Anfragebild: Falls Distanz d(m qx, m ij ) < t, dann erhält Bild i eine Stimme Auswahl des Bildes mit den meisten Stimmen à (Korrektheit? Effizienz?) Schmid, Mohr: Local Grayvalue Invariants for Image Retrieval. PAMI, 19(5):530-534, 1997. Computergrafik 2 SS2011 9

SKALENRAUM Computergrafik 2 SS2011 10

Robustheit des Harris Corner Detektors Invariant gegenüber Helligkeitsänderungen bis zu einem gewissen Grad Invariant gegenüber Translation und Rotation Nicht invariant gegenüber Skalierung Kante skalieren Ecke Computergrafik 2 SS2011 11

Repeatability Starke Abhängigkeit des Harris-Detektors von der Skalierung: 100% 80% 60% 40% 20% 0% 0 0.2 0.4 0.6 0.8 1 Computergrafik 2 SS2011 12

Skalierungsinvarianz Gewichtungen Bestimmung 1 4 6 4 1 *1/16 für eine Bildzeile der charakteristischen Größe eines interest points Kombiniert Harris-Corner-Detection mit Laplace-Operator Harris-Laplace-Methode Reduce-Operation Berechnung des Skalenraums für das Bild Berechnung von Harris-Corners Bildzeile für jede Skalierung à interest points Berechnung der zweiten Ableitung (Laplace-Operator) an den interest points Auswahl von Harris-Corners, die lokales Maximum entlang der Skalierungs-Achse aufweisen... Bild: K.Tönnies, Grundlagen der Bildverarbeitung Mikolajczyk, Schmid: Indexing Based on Scale Invariant Interest Points. ICCV 2001, pp. 525-531 Computergrafik 2 SS2011 13

Multiskalen-Repräsentation eines Signals Glätten eines 1D-Signals mit Gaußfiltern Gröbere Strukturen auf größeren Skalierungsstufen Signal f (Multiskalen-Repr.): zweite Ableitung f xx = 0: σ σ t σ 4 σ 3 σ 2 σ 1 Andrew P. Witkin: Scale-Space Filtering. IJCAI, pp. 1019-1022, 1983. Computergrafik 2 SS2011 14 t

Multiskalen-Repräsentation eines Bildes Glätten eines 2D-Signals mit Gaußfiltern Gröbere Strukturen auf größeren Skalierungsstufen Bild (Multiskalen-Repr.): σ 3 σ σ 2 y σ 1 x Computergrafik 2 SS2011 15

Charakteristische Skalierungsstufe Charakteristische Skalierung eines Merkmals ist lokales Extremum des LoG-Operators LoG-Operator: blob detector charakteristische Skalierung: σ = 10.1 (links) σ = 3.90 (rechts) Bild: Mikolajczyk, Schmid: Indexing Based on Scale Invariant Interest Points. ICCV 2001, pp. 525-531 Computergrafik 2 SS2011 16

Harris-Laplace-Methode (Mikolajczyk, Schmid, 2001) Glätten eines 2D-Signals mit Gaußfiltern Gröbere Strukturen auf größeren Skalierungsstufen Laplace der Gaußfunktion (LoG) Bild (Multiskalen-Repr.): LoG-Operator: σ Harris σ 3 y Harris Harris σ 2 σ 1 x ( ) = "2 G( x, y)! 2 G x, y ( ) + "2 G x, y "x 2 "y 2 = 1 $ x 2 + y 2 ' * & #1)exp # x2 + y 2 -, /!" 4 % 2" 2 ( + 2" 2. Computergrafik 2 SS2011 17

Harris-Laplace-Methode (Mikolajczyk, Schmid, 2001) Berechnung des Skalenraums Berechnung von Harris-Corners für jede Skalierung à interest points C(x,y,σ i ) > t h C(x,y,σ i ) > C(x w,y w,σ i ) mit (x w,y w ) 8-Nachbarn Berechnung der zweiten Ableitung (LoG-Operator) an den interest points Auswahl von Harris-Corners, die lokales Maximum des LoG entlang der Skalierungs-Achse aufweisen (x,y,σ i ) > t l L(x,y,σ i ) > L(x,y,σ i-1 ) L(x,y,σ i ) > L(x,y,σ i+1 ) Normalisierung bzgl. Skalierung notwendig Präzisere Variante durch Iteration über Ort und Skalierung σ y Harris Harris Harris σ 3 σ 2 σ 1 x Computergrafik 2 SS2011 18

LoG-Operator LoG-Operator:! 2 ( f xx (x, y,! )+ f yy (x, y,! )) Computergrafik 2 SS2011 19

Skalenraum: Betrag des LoG-Operators! 2 ( f xx (x, y,! )+ f yy (x, y,! )) Computergrafik 2 SS2011 20

Skalenraum: Betrag des DoG-Operators DoG ist effiziente Näherung für LoG (à Folien zu Kanten) ( f (x, y,! n!1 )! f (x, y,! n )) = ( f (x, y)*g(! n!1 )! f (x, y)*g(! n )) Computergrafik 2 SS2011 21

David Lowe: SIFT Interest Points SIFT = Scale Invariant Feature Transform DoG-Operator für Lokalisierung in Bild und Skalierung Interest points sind Maxima und Minima in 3D-Nachbarschaft x ist interest point, falls DoG(x) größer als alle 26 Nachbarn Quelle Abb.: David G. Lowe: Object Recognition from Local Scale-Invariant Features. Proc. of ICCV 1999. Computergrafik 2 SS2011 22

Robustheit gegenüber Skalierung Harris-Laplacian hat höhere repeatability als SIFT Harris-Laplacian SIFT Harris-standard Mikolajczyk, Schmid: Indexing Based on Scale Invariant Interest Points. ICCV 2001, pp. 525-531 Computergrafik 2 SS2011 23

FEATURE DESCRITOREN (MERKMALSVEKTOREN) Computergrafik 2 SS2011 24

David Lowe: Skalierungsinvariante lokale Merkmale (SIFT) Lokales Koordinatensystem um interest point invariant gegenüber Translation, Rotation, Skalierung David G. Lowe: Object Recognition from Local Scale-Invariant Features. Proc. of ICCV 1999. Computergrafik 2 SS2011 25

David Lowe: Skalierungsinvariante lokale Merkmale (SIFT) Skalierungsinvarianz Bestimme charakteristische Skalierung für jedes Merkmal Rotationsinvarianz Ausrichtung des lokalen patches entsprechend der dominanten Orientierung der Gradienten 120000 100000 80000 60000 40000 20000 0 Histogramm der Gradientenorientierungen im lokalen patch Auswahl der Maxima im Histogramm falls mehrere Maxima: ein Merkmalsvektor für jedes Maximum falls zu viele Maxima: Unterdrücken des Punktes 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 David G. Lowe: Object Recognition from Local Scale-Invariant Features. Proc. of ICCV 1999. Computergrafik 2 SS2011 26

SIFT Merkmalsvektor patch: 16x16 pixel im lokalen Koordinatensystem des den interest points Koordinatensystem lokalisiert in x, y, Skalierung, Orientierung 4x4 Orientierungshistogramme mit je 8 Orientierungen Gewichtet mit Gradientenlänge und Distanz zum Zentrum à 128 Dimensionen Quelle Abb.: David G. Lowe: Object Recognition from Local Scale-Invariant Features. Proc. of ICCV 1999. Computergrafik 2 SS2011 27

Bilderkennung mit SIFT Quelle Abb.: David G. Lowe: Object Recognition from Local Scale-Invariant Features. Proc. of ICCV 1999. Computergrafik 2 SS2011 28

SIFT for Mobile Devices [Wagner at al.] Variant of SIFT with 36 component feature vector Less computation (original feature vector: 128 components) Efficient computation of interest points Variant of FAST corner detector Process template at multiple scales Daniel Wagner, Gerhard Reitmayr, Alessandro Mulloni, Tom Drummond, Dieter Schmalstieg: Pose Tracking from Natural Features on Mobile Phones. Proc. ISMAR 2008. Computergrafik 2 SS2011 29

Interest Points Choose interest points Can be precisely located in images Robust and repeatable under changing lighting, perspectives, sizes, rotations Surrounding patch descriptive for the image Corners are well localized & robust Corners: No corners: Corner detection Idea: It s a corner if it s not part of a straight line Can be implemented efficiently Computergrafik 2 SS2011 30

Interest Points Corner response of pixel p = (x,y) // I(p) = intensity (grayscale value) of pixel p dmin = for all opposite points (p1,p2) on circle d1 = abs(i(p) - I(p1)) d2 = abs(i(p) - I(p2)) d = max(d1, d2) dmin = min(dmin, d) cornerresponse = dmin Non-maximum suppression Threshold to generate ~150 corners 3 4 5 2 6 1 p 1 d2 d1 6 2 5 4 3 3 4 5 2 6 1 p 1 6 2 5 4 3 Corner examples: Not corner examples: Computergrafik 2 SS2011 31

Mobile SIFT: Feature Descriptors Inspect 15x15 pixel patch around corner point Compute gradient magnitudes and orientations Convolution with a derivative of Gaussian kernel Original image: Gradient magnitudes: Gradient orientations: θ large mag. small mag. 120000 Orientation histogram with 36 buckets (each covering 10 ) 100000 80000 60000 40000 20000 0 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 Computergrafik 2 SS2011 32

Mobile SIFT: Feature Descriptors Compute dominant orientations (within 80% of max) Weighted by distance patch center Discard feature if too many orientations Rotate patch to each dominant orientation Computergrafik 2 SS2011 33

Mobile SIFT: Feature Descriptors Patch rotated to dominant orientation Create 3x3x4-component SIFT vector 9 sub-regions (3x3 patches) 4 orientations For 3x3 sub-patches with 5x5 pixels each Compute gradient magnitudes and orientations Compute orientation histogram with 4 buckets (each covering 90 ) Normalize feature vector (length 1) Limit longest component to 0.2, renormalize Example feature vector with 36 components: Computergrafik 2 SS2011 34

Mobile SIFT: Scale Space for Template Compute SIFT features for multiple scales Allows recognizing features over wider range of scales Scale 0 Scale 1 Scale 2 Scale 3 Scale 4 Scale space pyramid width(i+1) = width(i) / sqrt(2) Computergrafik 2 SS2011 35

Mobile SIFT: Feature Matching SIFT features are robust to perspective distortion Each individual feature relatively weak (about 30-40% correct matches) Find best feature matches Given query descriptor, find closest descriptor in template Distance measure: sum of squared distances (ssd) Match: pairs of SIFT features in camera image and template (minimum ssd) Search: very time consuming for linear search, use approximate nearest neighbor KD tree [Marius Muja and David G. Lowe. Fast approximate nearest neighbors with automatic algorithm configuration. International Conference on Computer Vision Theory and Applications (VISAPP), Lisbon, Portugal, Feb. 2009.] [Silpa-Anan, Hartley: Optimised KD-trees for fast image descriptor matching. CVPR 2008.] Computergrafik 2 SS2011 36

Mobile SIFT: Feature Matching Found feature matches may be wrong Might not be identical, even though descriptor very close Removing outliers from feature matches Orientation difference test For all matches compute orientation differences Remove all matches ±30 from histogram peak Works best for planar scenes 80 70 60 50 40 30 20 10 0-180 -130-80 -30 20 70 120 170 Computergrafik 2 SS2011 37

Mobile SIFT: Feature Matching Line test Select two good (small ssd) matches: (fq1, ft1), (fq2, ft2) Compute line lq through (fq1, fq2) in query image Compute line lt through (ft1, ft2) in template image For other matches (q,t): position of q to lq should be same as t to lt Measure number of inliers for (lq, lt) If inlier rate >70% then assume line is correct and remove outlier matches Query image Template image Query image Template image fq1 q lq fq2 match match match t lt ft1 ft2 fq1 q lq fq2 match match match ft1 lt t ft2 Computergrafik 2 SS2011 38

Matching Images in large Databases Scalability Find matching image in large database Vocabulary trees Term Frequency Inverse Document Frequency (TF-IDF) [Nister, Stewenius: Scalable Recognition with a Vocabulary Tree. CVPR 2006.] Vocabulary trees: Computergrafik 2 SS2011 39

THE END J Computergrafik 2 SS2011 40