Abschätzung des Disparitätsraums für das Stereo-Matching mithilfe von Bildmerkmalen



Ähnliche Dokumente
Professionelle Seminare im Bereich MS-Office

Wasserfall-Ansätze zur Bildsegmentierung

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Grundlagen der Theoretischen Informatik, SoSe 2008

Elementare Bildverarbeitungsoperationen

11. Das RSA Verfahren und andere Verfahren

Algorithmen II Vorlesung am

Lichtbrechung an Linsen

PVL 3 - Roulette. (5 Punkte) Abgabe bis

Prozentrechnung. Klaus : = Karin : =

WORKSHOP für das Programm XnView

Tangentengleichung. Wie lautet die Geradengleichung für die Tangente, y T =? Antwort:

ACDSee Pro 2. ACDSee Pro 2 Tutorials: Übertragung von Fotos (+ Datenbank) auf einen anderen Computer. Über Metadaten und die Datenbank

Kapitalerhöhung - Verbuchung

Übungsaufgaben. - Vorgehensweise entsprechend dem Algorithmus der schriftlichen Multiplikation

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum

Konzepte der Informatik

Paper Computer Science Experiment

Lineare Gleichungssysteme

Teil III: Routing - Inhalt I. Literatur. Geometric Routing. Voraussetzungen. Unit Disk Graph (UDG) Geometric Routing 29

Welche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen?

Was meinen die Leute eigentlich mit: Grexit?

Wir machen neue Politik für Baden-Württemberg

Abiturprüfung Mathematik 2008 (Baden-Württemberg) Berufliche Gymnasien ohne TG Analysis, Aufgabe 1

Die Übereckperspektive mit zwei Fluchtpunkten

Übungen zu Einführung in die Informatik: Programmierung und Software-Entwicklung: Lösungsvorschlag

Primzahlen und RSA-Verschlüsselung

Serienbrieferstellung in Word mit Kunden-Datenimport aus Excel

PowerPoint vertonen. by H.Schönbauer 1

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?

Viele Bilder auf der FA-Homepage

Nachhilfe-Kurs Mathematik Klasse 13 Freie Waldorfschule Mitte

Plotten von Linien ( nach Jack Bresenham, 1962 )

Anmerkungen zur Übergangsprüfung

Lineare Funktionen. 1 Proportionale Funktionen Definition Eigenschaften Steigungsdreieck 3

1 topologisches Sortieren

Leitprogramm Bubblesort

5. Bildauflösung ICT-Komp 10

HIER GEHT ES UM IHR GUTES GELD ZINSRECHNUNG IM UNTERNEHMEN

Angebot. UVV-Prüfungen und Wartungen von mobilen Abfallpressen

14. Minimale Schichtdicken von PEEK und PPS im Schlauchreckprozeß und im Rheotensversuch

Grundlagen der Informatik

6.2 Scan-Konvertierung (Scan Conversion)

Theoretische Grundlagen der Informatik WS 09/10

Teaser-Bilder erstellen mit GIMP. Bildbearbeitung mit GIMP 1

ACDSee 10. ACDSee 10: Fotos gruppieren und schneller durchsuchen. Was ist Gruppieren? Fotos gruppieren. Das Inhaltsverzeichnis zum Gruppieren nutzen

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Zahlen und das Hüten von Geheimnissen (G. Wiese, 23. April 2009)

Installation der Eicon Diva PCI Karte unter Windows XP

Übungsaufgaben Tilgungsrechnung

Wir gehen aus von euklidischen Anschauungsraum bzw. von der euklidischen Zeichenebene. Parallele Geraden schneiden einander nicht.

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Im Original veränderbare Word-Dateien

Erwin Grüner

10. Elektrische Logiksysteme mit

Anleitung zum Computercheck So aktualisieren Sie Ihr Microsoft- Betriebssystem

AutoCAD Dienstprogramm zur Lizenzübertragung

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Erfahrungen mit Hartz IV- Empfängern

Informationsblatt Induktionsbeweis

Pädagogische Hochschule Thurgau. Lehre Weiterbildung Forschung

Eine Logikschaltung zur Addition zweier Zahlen

Algorithmische Mathematik

Festigkeit von FDM-3D-Druckteilen

ACDSee 9 Foto-Manager

Binäre Gleitkommazahlen

Sparda mobiletan Nutzungsanleitung

Anleitung zum Computercheck So aktualisieren Sie Ihr Microsoft-Betriebssystem

Internet Explorer Version 6

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Software Engineering. Sommersemester 2012, Dr. Andreas Metzger

, WS2012 Übungsgruppen: Mo.,

Kosten-Leistungsrechnung Rechenweg Optimales Produktionsprogramm

II. Daten sichern und wiederherstellen 1. Daten sichern

Lehrer: Einschreibemethoden

Inhalt. Allgemeine Einführung. Argumentationsvermögen. Räumliches Vorstellungsvermögen. Begabungen und Fähigkeiten messen

Bereich METIS (Texte im Internet) Zählmarkenrecherche

Systeme 1. Kapitel 6. Nebenläufigkeit und wechselseitiger Ausschluss

Nicht über uns ohne uns

Übungskomplex Felder (1) Eindimensionale Felder Mehrdimensionale Felder

Meinungen der Bürgerinnen und Bürger in Hamburg und Berlin zu einer Bewerbung um die Austragung der Olympischen Spiele

Daten sammeln, darstellen, auswerten

in vielen technischen und wissenschaftlichen Anwendungen erforderlich: hohe Präzision große Dynamik möglich durch Verwendung von Gleitkommazahlen

Die neuen Familienleistungen machen vieles leichter. Kinderbetreuungskosten.

Wonneberger Homepage

Stereo Vision. Projekt zur 3D Computer Vision Wintersemester 05/06

Windows 7 Arbeiten mit Fenstern

Bernadette Büsgen HR-Consulting

Ihr Einkommensteuertarif:

1. Wie viel Zinsen bekommt man, wenn man 7000,00 1 Jahr lang mit 6 % anlegt?

ARCHIV- & DOKUMENTEN- MANAGEMENT-SERVER DATEIEN ARCHIVIEREN

Novell Client. Anleitung. zur Verfügung gestellt durch: ZID Dezentrale Systeme. Februar ZID Dezentrale Systeme

Informationssysteme Gleitkommazahlen nach dem IEEE-Standard 754. Berechnung von Gleitkommazahlen aus Dezimalzahlen. HSLU T&A Informatik HS10

Bedienungsanleitung für den Online-Shop

Informatik 2 Labor 2 Programmieren in MATLAB Georg Richter

W-Rechnung und Statistik für Ingenieure Übung 11

Individuelles Qualifikationsprofil für

Kreatives Occhi. - V o r s p a n n - Alle Knoten und Knüpfelemente sowie ihre Verwendbarkeit. Die Knoten

Jeopardy and andere Quizformate im bilingualen Sachfachunterricht Tipps zur Erstellung mit Powerpoint

Mit dem Tool Stundenverwaltung von Hanno Kniebel erhalten Sie die Möglichkeit zur effizienten Verwaltung von Montagezeiten Ihrer Mitarbeiter.

Transkript:

Abschätzung des Disparitätsraums für das Stereo-Matching mithilfe von Bildmerkmalen Erarbeitet im Rahmen der Masterarbeit (eingereicht Sept. 2012): Beleuchtungsinvariante und rauschintensive Disparitätskartenberechnung Autor: Christoph Drexler, Innsbruck, christoph@drexler.eu Betreuung: Dr. Klaus Häming, Prof. Dr. Gabriele Peters,, Fernuniversität in Hagen Präsentation im Rahmen des Wissenschafts- und Absolventenworkshops auf den Informatiktagen der Gesellschaft für Informatik 2013-03-22, 11:45 Uhr

Stereo-Matching Standardfall Off-axis-Konstellation, d.h.: parallele auf in Kameraachsen gleicher Höhe gleichem Abstand zur Szene kalibriert kontrollierte Beleuchtungsbedingungen sehr viele Autor/inn/en entwerfen ihre Algorithmen für diesen Standardfall (s. Middlebury Datasets, Middlebury Evaluation) 2

Stereo-Matching Standardfall Rückschlüsse auf die Tiefendimension der Szene zu lokale Algorithmen : Berechnung der Kosten für das Matching zweier Bildpixel Suche eingeschränkt auf selbe Bildzeile Disparitätsraum meist vorgegeben (s. Middlebury Evaluation) Berechnung der Disparität (=Positionsdifferenz) jedes einzelnen Pixels lässt Berechnung vergleichsweise einfach, Bilderzeugung relativ aufwändig (Kalibrierung, Sonderequipment) Standardfall ist eigentlich ein sehr spezieller Sonderfall Disparität 3

Stereo-Matching Allgemeiner Fall Kameraachsen stehen windschief zueinander dadurch deutlich größerer Disparitätsraum Off-Axis: hier von 27 bis 81 = 55 Disparitätsstufen gezeigtes Beispiel: von -56 bis 118 = 175 Disparitätsstufen Kontext: Freihanderfassung von 3D-Objekten ermöglicht theoretisch kaum Einschränkungen bzgl. Disparitätsraum Disparitäten von {Bildbreite} bis +{Bildbreite} möglich 4

Abschätzung des Disparitätsraums Down- und Upscaling z. B. Reduktion von 800x600 auf 200x150 Pixel Berechnung mithilfe der verkleinerten Bilder für den Disparitätsraum [-100,100] Berechnung mithilfe der großen Bilder für die Disparitätsstufen [dmin,dmax] oder [d-ε,d+ε], wobei d := 4 * bei der vorherigen Berechnung erhaltenes Ergebnis für andere Zwecke bereits erprobtes Verfahren, z. B. [Hirschmüller2008] zur effizienten Berechnung der Kostenfunktion HMI [Hirschmüller2008]: Hirschmüller, Heiko: Stereo Processing by Semi-Global Matching and Mutual Information. In: IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI) 30 (2008), S. 328-341. Online: http://elib.dlr.de/55367/1/stereo_processing-hirschmüller.pdf (Abrufdatum: 2013-03-15). z. B. [Won2011] zur Verringerung des Speicherbedarfs und effizienten Berechnung [Won2011]: Won, Kwang Hee ; Jung, Soon Ki: hsgm: Hierarchical Pyramid Based Stereo Matching Algorithm. In: BlancTalon, Jaques et al. (Hrsg.): Advances Concepts for Intelligent Vision Systems. Berlin ; Heidelberg : Springer, 2011 (Lecture Notes in Computer Science ; 6915), S. 693-701. Online: http://dx.doi.org/10.1007/978-3-642-23687-7_62. (neue?) Idee: Verwendung der für die Rektifizierung ermittelten Bildmerkmale (Features) 5

Exkurs: Rektifizierung Allgemeiner Fall (windschiefe oder kreuzende Kameraachsen): korrespondierende Bildpunkte liegen nicht notwendigerweise auf derselben Bildzeile Durch die sog. Rektifizierung wird das Bild so umgerechnet (verzerrt), dass zusammengehörige Bildpunkte wieder auf einer Bildzeile liegen 6

Exkurs: Rektifizierung benötigt mind. 7 Paare von Bildmerkmalen ( Features ) üblicherweise sehr viel mehr korrespondierende Bildpunkte im 3-stelligen Bereich Disparitäten dieser Bildmerkmale sind bekannt bzw. sehr einfach berechenbar Ausgangspunkt zur Abschätzung des Disparitätsraums 7

Abschätzung des Disparitätsraums 1.Setze den Disparitäts(such)raum für die gefundenen Bildmerkmale auf den errechneten Disparitätswert: [d, d+1[ 2.Finde zu jedem Bildmerkmal seine 5 Nachbarn nach dem Kriterium der Farbdistanz: D( p, q) = max ( r p r q, g p g q, b p b q ) 3.Interpoliere den Disparitätsraum zwischen je zwei benachbarten Bildmerkmalen. 4.Erweitere den Disparitätsraum nach unten und oben um einen fixen Wert: [dp, dp+1[ => [dp ε, dp+1+ε[ 8

Abschätzung des Disparitätsraums 5.Verteile die gefundenen Disparitätsräume auf benachbarte Pixel derselben Unterstützungsregion. Unterstützungregionen nach dem Modell der Cross-based Aggregation, d. h. in den vier Hauptrichtungen wird der Unterstützungsarm so lange verlängert, solange gilt: 9

Abschätzung des Disparitätsraums 6.Wiederhole diesen Schritt zwei Mal. [Mei2011]: Mei, Xing ; Sun, Xun ; Zhou, Mingcai et al.: On Building an Accurate Stereo Matching System on Graphics Hardware. In: GPUCV'11: ICCV Workshop on GPU in Computer Vision Applications, 2011. Online: http://xingmei.net/resource/pdf/adcensus.pdf (Abrufdatum: 2013-03-15). 7.Verteile den Disparitätsraum auf eine fixe Zahl von Nachbarpixeln in den vier Hauptrichtungen (Kohärenz). 10

Abschätzung des Disparitätsraums 8.Führe den Stereo-Matching-Algorithmus für alle Pixel durch, für die bisher ein Disparitätsraum abgeschätzt wurde. 9.Verwende die errechneten Disparitäten zur Initialisierung des nächsten Iterationsschrittes, bis ein festgelegtes Abbruchkriterium (z. B. Berechnung von mind. 80 % der gültigen Pixel) eintritt. 11

Evaluation: Setting Erprobt an 8 Bildpaaren: 3 Bildpaare der auch in der Middlebury Stereo Evaluation verwendeten Middlebury Stereo Datasets: Venus, Teddy, Cones siehe http://vision.middlebury.edu/stereo/eval/ 5 Bildpaare, von Dr. Klaus Häming (Lehrgebiet MenschComputer-Interaktion) erstellt 2x Off-Axis, 1x gekreuzt, 1x gekreuzt&gedreht, 1x hintereinander Verwendung von überprüften (also korrekt zugeordneten) Paaren von Bildmerkmalen Abbruchkriterium: Abschätzung des Disparitätsraums für mind. 80% der gültigen Bildpunkte erreicht, spätestens nach 5 Iterationen 12

Evaluation: Ergebnisse Wenn viele Bildmerkmalspaare vorhanden: sehr gute Abschätzung in 5 Fällen >=80% nach dem ersten Iterationsschritt v. a. innerhalb der konvexen Hülle der Bildmerkmale Clown-in-front Venus Teddy Cones Raum Off-Axis 13

Evaluation: Ergebnisse In 2 Fällen 2 Iterationen, in einem Fall 4 Iterationen nötig Fehler werden tw. im nächsten Schritt korrigiert Sokrates Wohnraum Clown-Sokrates 14

Evaluation: Ergebnisse Algorithmus überträgt Disparitätsraum gut auf frontoparallele und wenig geneigte Flächen Algorithmus versagt bei schiefen Flächen und an Diskontinuitäten Fehler an schiefen Flächen werden im nächsten Schritt gut korrigiert An Diskontinuitäten versagt die Einschätzung oft auch im nächsten Schritt Schlechtestes Abschneiden beim Bildpaar Clown-Sokrates nur 4 Bildmerkmalspaare Grund: verdrehte Kameraachse würde auch eine Rektifizierung unmöglich machen Berechnungsaufwand gegenüber Berechnung aller Disparitätsstufen von der minimalen bis zur maximalen (als bekannt vorausgesetzten) Disparitätsstufe Venus 133,8 %; Teddy 53,8 %; Cones 57,3 %; Sokrates 91,2 %; Raum Off-Axis 63,2 %; Clown-Sokrates 17,5 %; Wohnraum 38,1 %; Clown-in-front 41,4 % in fast allen Fällen starke Einsparung von Rechenaufwand Ausnahme Venus : kleinstes Bildpaar mit wenigsten (20) Disparitätsstufen 15

Offene Fragen Wie könnte die Bestimmung benachbarter Bildmerkmale vereinfacht werden? Wie könnte die Abschätzung des Disparitätsraums an den Diskontinuitäten verbessert werden? Wie schneidet der Algorithmus im Vergleich zu einem Down-/Upscaling-Vorgehen ab? Wie im Vergleich zu anderen Algorithmen? Vgl. z. B. Jan Cech: Growing Correspondence Seeds A Fast Stereo Matching of Large Images. Online: http://cmp.felk.cvut.cz/~cechj/gcs/ (Abrufdatum: 2013-03-17). 16

Bildnachweis, Sourcecode 3D camera pistol grip, 3D shoot auf flickr (CC BY-NC-SA 2.0) Bilder Venus, Teddy, Cones : Middlebury Stereo Datasets vgl. http://vision.middlebury.edu/stereo/data/ Bilder Clown-in-front, Clown Sokrates, Sokrates, Raum Off-Axis, Wohraum : von Dr. Klaus Häming,, Fernuniversität in Hagen, für die Evaluationszwecke dieser Masterarbeit erstellt mithilfe von 3D-Modellen und Texturen von Carlos Folch, http://resources.blogscopia.com/ und Texturen von Antti Lehtinen, http://www.polygonblog.com/seamless-texture/ Quelltext: Doppellizenz (GPL und CC BY-NC-SA 3.0 Austria) git@bitbucket.org:christophdrexler/masterarbeit.git 17