Entwicklung einer robusten Methode zur Berechnung von Stereokorrespondenzen

Ähnliche Dokumente
Stereo Vision Anwendungen 2 / Sommersemester 2010 Fakultät Technik und Informatik Department Informatik Gregory Föll

Ausarbeitung. Gregory Föll Stereo Vision: Vergleich verschiedener Algorithmen zur Lösung des Korrespondenzproblems

Ausarbeitung. Gregory Föll Entwicklung einer robusten Methode zur Berechnung von Stereokorrespondenzen

Stereo Vision. Projekt zu Grundlagen der Computer Vision. Sommersemester 2008

Bildverarbeitung: 3D-Geometrie. D. Schlesinger () Bildverarbeitung: 3D-Geometrie 1 / 13

Scene Reconstruction with Multiple View Geometry

Stereo Vision. Projekt zur 3D Computer Vision Wintersemester 05/06

Masterarbeit. Gregory Föll Robuste Tiefenbildgewinnung aus Stereobildern

Suche nach korrespondierenden Pixeln

Stereo. Korrespondenzproblem -> Disparitätenkarte

How To Create A Panorama Image From A Photoelectric Image From An Image From The Camera (I)

Stereo-Matching. Medieninformatik IL. Andreas Unterweger. Vertiefung Medieninformatik Studiengang ITS FH Salzburg. Wintersemester 2014/15

3. Analyse der Kamerabewegung Video - Inhaltsanalyse

Dreidimensionales Computersehen

Proseminar "Aufgabenstellungen der Bildanalyse und Mustererkennung"

Projektion. Ebene geometrische Projektionen

3. Analyse der Kamerabewegung Video - Inhaltsanalyse

View Morphing. Department of Computer Sciences University of Wisconsin Madison publiziert in SIGGRAPH 96, pp

Visual Servoing using Mutual Information

Statische Stereoanalyse

5. Objekterkennung in Bildern und Videos Videoanalyse

Computer Vision I. Nikos Canterakis. Lehrstuhl für Mustererkennung Universität Freiburg

Objekterkennung mit SIFT-Merkmalen

Grundproblem: Projektion von 3D in 2D bewirkt Verlust der Tiefeninformation.

Ein Structure and Motion Ansatz zur Umfeldrekonstruktion in komplexen Fahrzeugumgebungen

Prof. J. Zhang Universität Hamburg. AB Technische Aspekte Multimodaler Systeme. 13. Januar 2004

Technische Universität. Fakultät für Informatik

12 Übungen zu Gauß-Algorithmus

geschlossene Schachtel mit einem kleinen Loch

Lineare Transformationen, Teil 1 Lösungen zu den Aufgaben. 1 E1 Ma 1 Lubov Vassilevskaya

Bachelorverteidigung Marco Franke

Computer Vision I. Nikos Canterakis. Lehrstuhl für Mustererkennung, Universität Freiburg,

Structure-from-Motion. Christina Mundhenk Leo Sylvio Rüdian Marcel Kliemannel

Transformationen im 3D-Raum

Affine Koordinatentransformationen

Computer Vision I. Nikos Canterakis. Lehrstuhl für Mustererkennung, Universität Freiburg

Geometrie. Hallo Welt! für Fortgeschrittene Simon Kuhnle. 11. Juli

3.1 Motivation. - Mit (mehreren) Koordinatentransformationen wird das Objektsystem in das Gerätesystem transformiert.

Unterrichtsreihe zur Parabel

Parallele Algorithmen in der Bildverarbeitung

Warping im Detail $KNFXGTCTDGKVWPIWPF#NIQTKVJOGP 2TQH &T9QNHICPI-QPGP. Bildverarbeitung und Algorithmen SS Konen, Zielke

Einführung in die Robotik. Jianwei Zhang

Stereovision: Grundlagen

3D Rendering mit PHP. Die neue PEAR-Klasse Image_3D bietet die Möglichkeit nur mit PHP5 3DGrafiken zu rendern

Computer Vision: 3D-Geometrie. D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17

Algorithmische Geometrie: Delaunay Triangulierung (Teil 2)

Interaktive Lokalisierung durch Objekterkennung

Computergrafik Universität Osnabrück, Henning Wenke,

EVC Repetitorium Blender

Navigation anhand natürlicher Landmarken mit Hilfe der Scale Invariant Feature Transform. Thorsten Jost INF-M2 AW1 Sommersemester

Einführung in die Robotik. Jianwei Zhang

2D, 3D Kameratechnik in der Robotik. Jan Fischer

Modellbasiertes Suchen von Objekten

Geometrie 2. Julian Fischer Julian Fischer Geometrie / 30

Vorlesung Algorithmische Geometrie Konvexe Hülle in R 3

3 Koordinatentransformationen

Algorithmische Geometrie

Bildbearbeitung und Texturierung

3D-Transformationen. Kapitel Translation Skalierung

(7) Normal Mapping. Vorlesung Computergraphik II S. Müller. Dank an Stefan Rilling U N I V E R S I T Ä T KOBLENZ LANDAU

Warum konnten wir Inversionen so erfolgreich beim Lösen von schulgeometrischen Aufgaben anwenden?

3D-Transformationen. Kapitel Translation Skalierung

Technische Universität München Zentrum Mathematik

Was bisher geschah. Definition digitaler Bilder B : pos col Bildanalyse, statistische Merkmale Signale im Orts- und Frequenzraum Bildbearbeitung durch

Der Einbau im Auto. Stereo: Beispiel Fahrzeug. Einbau im Rückspiegel Erfassung von. Reichweite: bis 30 m

Landesabitur 2007 Beispielaufgaben 2005_M-LK_A 7. Eine quadratische Pyramide (Grundkante 4 und Höhe 6) steht neben einer Stufe. 1.

Computer Vision I. Nikos Canterakis. Lehrstuhl für Mustererkennung, Universität Freiburg

Die Gruppe der affinen Abbildungen A

Perlen der Informatik I Wintersemester 2012 Aufgabenblatt 7

Euklidsche räumliche Bewegung (Rotation und Translation):

-dimensionale Darstellungen

Einleitung 2. 1 Koordinatensysteme 2. 2 Lineare Abbildungen 4. 3 Literaturverzeichnis 7

Projektionen für f r die Scanregistrierung mit Hilfe von Bildmerkmalen

Lineare Funktionen. Aufgabe 1. Sei f R 2 R definiert durch. x 1 + 3x Beweisen Sie ausführlich, dass f linear ist.

Kognitive Systeme Übung 5+6: Bildverarbeitung & Wissenrepräsentation, Planung und Robotic

Projektive Geometrie

Hauptprüfung Fachhochschulreife Baden-Württemberg

Transformation - 3. Für "übliche" Anwendungen in der Geometrie ist es sinnvoll, bei Transformationen eine gleiche

Dynamische Geometrie

Parametrische Suche als Algorithmen Paradigma

Bildregistrierung in der Medizin. Fethi KAYA - Yusuf ÖZBEK

Mathematische Grundlagen

k-nächste-nachbarn-schätzung

Verzeichnung und Messgenauigkeit aufgrund der Verzeichnung. Tutorial

Computergrafik 1 Transformationen

Medienforensik - Manipulationserkennung. Multimedia Sicherheit, Martin Steinebach

Morphologische Bildverarbeitung II

Implementierung des Scan-Matching-Algorithmus MbICP im Fach Mensch-Maschine- Kommunikation/Robotik

Prof. J. Zhang Universität Hamburg. AB Technische Aspekte Multimodaler Systeme. 20. Januar 2004

m2l 60.odt Klausur 12/I B 1. Gegeben seien zwei Geraden. Wie gehen Sie vor, um über deren Lagebeziehung eine Aussage zu treffen.

Seminar. Visual Computing. Poisson Surface Reconstruction. Peter Hagemann Andreas Meyer. Peter Eisert: Visual Computing SS 11.

Prof. J. Zhang Universität Hamburg. AB Technische Aspekte Multimodaler Systeme. 16. Dezember 2003

3D-Aspekte bei der Bildfusion am Beispiel von IR- und VIS-Daten Referenten: Dipl.-Ing. Torsten Koch PD Dr. Karl-Heinz Franke

Programmierpraktikum WS 16/17

5. Geraden und Ebenen im Raum 5.1. Lineare Abhängigkeit und Unabhängigkeit von Vektoren

Inhaltsverzeichnis. 1 Hardwaregrundlagen

SIFT Flow Dense Correspondence across Different Scenes

Transkript:

Entwicklung einer robusten Methode zur Berechnung von Stereokorrespondenzen Seminar - Wintersemester 2010/2011 Fakultät Technik und Informatik Department Informatik Gregory Föll

Übersicht Rückblick Stereo Vision: Wiederholung PJ2 / Masterarbeit 2

AW1 Zielsetzung: Entwicklung einer Hinderniserkennung für das FAUST-onyx-Fahrzeug Untersuchung unterschiedlicher Methoden Erkenntnis: Stereo-Kamera basierte Verfahren besser für Hinderniserkennung geeignet als monokulare Ansätze 3

PJ1 Stereo Vision: Vergleich verschiedener Algorithmen zur Lösung des Korrespondenzproblems Erkenntnis: Alle untersuchten Verfahren erzeugen unsaubere Disparitätskarten bei realem Bildmaterial Zielsetzung für PJ2 / Masterarbeit: Entwicklung einer eigenen Methode zur Lösung des Korrespondenzproblems in Stereoaufnahmen BM SGBM HH 4

Übersicht Rückblick Stereo Vision: Wiederholung PJ2 / Masterarbeit 5

Stereo Vision Gleichzeitige Aufnahme eines Objekts aus zwei unterschiedlichen Blickwinkeln Berechnung der räumlichen Ausdehnung des Objekts mittels der Unterschiede in den beiden Aufnahmen 6

Triangulation Bestimmen des Dreiecks durch zwei Winkel und eine Seite Winkel: Kombination zwischen Fokusierungsrichtung und Disparität Seite: Basislinie (Abstand zwischen Linsenzentren) 7

Korrespondenzproblem Welche Pixel im Bild R stimmen mit welchen Pixeln im Bild T überein? 2D-Suchraum? Nein! Jeder Ort P im Bild R kann nur Orte im Bild T zeigen, die auf einer Linie liegen, die die Projektion von P nach T ist Diese Linie heißt Epipolarlinie und beschränkt die Suche nach Korresponenzpaaren auf einen 1D-Suchraum 8

Epipolarebene Die Ursprungsorte der beiden Kamerakoordinatensysteme und ein beliebiger Punkt im 3D-Raum, bestimmen eine Epipolarebene Jeder Punkt in dieser Ebene wird auf dieselben beiden Epipolarlinien in den beiden Bildern projiziert 9

Standardform / kanonische Stereogeometrie Zur Vereinfachung wird das Stereobild so transformiert, als ob die optischen Achsen der beiden Kameras parallel zueinander sind und in derselben Ebene liegen: Danach liegen Punkte beider Bilder mit gleichem y-wert auf der gleichen Epipolarlinie 10

Disparität und Tiefe Die Disparität ist der Unterschied der x-koordinaten zwei korrespondierender Punkte ( x r x t ). Sie wird als Graustufenbild kodiert, wobei hellere Bereiche näher dran sind, daraus kann dann eine Tiefenkarte berechnet werden Je näher ein Punkt an der Kamera liegt, desto größer ist die Disparität 11

Problem Verzerrungen und Rauschen Spiegelnde Oberflächen 12

Verschiedene Ansichten Homogene Oberflächen 13

Übersicht Rückblick Stereo Vision: Wiederholung PJ2 / Masterarbeit 14

Anforderungen an die zu entwickelnde Methode Gute Ergebnisse bei realem Bildmaterial (innen/außen) Möglichst robust gegenüber Rauschen, Spiegelungen und homogenen Flächen Automatische Anpassung der Disparitäten an die Distanzen ohne aufwändige Bildanalysen Geschwindigkeit des Verfahrens ist zunächst nicht von Bedeutung 15

Möglicher Ansatz Auffinden einiger zuverlässiger Korrespondenzen Anhand der gefundenen Korrespondenzen das Bild in kleine Bereiche aufteilen und zwar so, dass jeder Bereich in beiden Bildern eine (dieselbe) Ebene beschreibt Korrespondenzen für jeden Pixel jeder gefundenen Ebene mit der projektiven Transformation berechnen Verbleibende Korrespondenzen mit Hilfe von dynamischer Programmierung finden 16

Merkmalsextraktion Im ersten Schritt wird ein Satz zuverlässiger Korrespondenzen mit Hilfe von SIFT oder SURF bestimmt SIFT und SURF sind Algorithmen, die Merkmale in Bildern bestimmen können. Die extrahierten Merkmale sind invariant gegenüber Rauschen, Beleuchtung, Skalierung, Translation und Rotation Gefundene Korrespondenzen müssen anschließend mit einem geeigneten Verfahren verifiziert werden (z.b. mit dem RANSAC-Algorithmus) 17

Bildsegmentierung Delaunay-Triangulation wird eingesetzt, um das Bild anhand der, durch SIFT/SURF, gefundenen korrespondierenden Punkte in kleine Bereiche zu unterteilen Mit dem Verfahren der Delaunay-Triangulation wird eine Punktmenge so zu Dreiecken vernetzt, dass innerhalb des Kreises, auf dem die drei Dreieckspunkte liegen, keine anderen Punkte enthalten sind Anschließend muss mit einem geeigneten Verfahren geprüft werden, ob die gebildeten Bildbereiche lokal eine Ebene beschreiben 18

Projektive Transformation Die einzelnen Bildsegmente können nun mit Hilfe der projektiven Transformation (Planar Homography) von der ersten Bildansicht zur zweiten komplett übertragen werden Die 3x3 Transformationsmatrix kann aus mindestens vier Punktkorrespondensen berechnet werden 19

Finden verbleibender Korrespondenzen Einige Stereokorrespondenzalgorithmen basieren auf dynamischer Programmierung (DP) und sind damit sehr erfolgreich Für einen DP-Ansatz muss eine passende Kostenfunktion definiert werden Durch die projektive Transformation werden bereits viele zuverlässige Korrespondensen gefunden. Die gefundenen Punkte sollen den DP- Algorithmus stabilisieren und da weniger Punkte berechnet werden müssen, auch beschleunigen Da durch die projektive Transformation ganze Bildbereiche über mehrere Zeilen zuverlässig gemappt werden, entfällt die aufwändige und oft nicht mögliche Anpassung der Disparitäten 20

Fragen... 21