4. Segmentierung von Objekten Video - Inhaltsanalyse

Ähnliche Dokumente
Modul Digitale Bildverarbeitung SS16 Bestandteile der Lehrveranstaltung und Prüfung: Vorlesungen Übungsserien Praktika (ImageJ) bis Mai 2016 Projekt

Grundlagen von Rasterdaten

Objekterkennung durch Vergleich von Farben. Videoanalyse Dr. Stephan Kopf HWS2007 Kapitel 5: Objekterkennung

Fotografie * Informatik * Mathematik * Computer-Algebra * Handreichung für Lehrer

Kapitel 9. Kombination von Vektor- und Rasterdaten. Rasterdaten. 3. Transformationen des Formats. 4. Kombinierte Auswertungen

Nichtrealistische Darstellung von Gebirgen mit OpenGL

Übersicht der Vorlesung

Morphologische Bildverarbeitung II

Hauptdiplomklausur Informatik August 2007: Multimedia Technology

INTELLIGENTE DATENANALYSE IN MATLAB

Eine zweidimensionale Stichprobe

Morphologie auf Binärbildern

Kapitel 1 Beschreibende Statistik

Digitale Bildverarbeitung Einheit 12 3D-Modellierung

Seminar SS 2006 Intelligent Virtual Characters

Lineare Gleichungssysteme (Teschl/Teschl 11.1)

Matrizen, Determinanten, lineare Gleichungssysteme

Praktikumssemesterarbeit für Numerik Aufgabe 1 HU-Berlin, Sommersemester 2005

Iterative Methods for Improving Mesh Parameterizations

Segmentierung von Faserstrukturen in tomographischen Aufnahmen. Workshop Analyse der Mikrostruktur von Faserverbundwerkstoffen in Volumenbildern

Binärbildverarbeitung

Entwicklung eines 3D-Scanners mit farbigem strukturiertem Licht unter Verwendung von HDR-Bilddaten. Diplomverteidigung Frank Michel

Lineare Gleichungssysteme

Inhaltsverzeichnis. 3. Erläuterungen zu den Programmbeispielen Arbeitsblätter 13

r a t u Parametergleichung der Geraden durch den Punkt A mit dem Richtungsvektor u t R heisst Parameter

Eine lineare Abbildung ist bijektiv, d.h. ihre Matrix ist invertierbar, falls und nur falls

Praktikum Sensitometrie Bestimmung des Signal Rausch Verhältnisses (SRV) eines Flachbett-Scanners

A2.3 Lineare Gleichungssysteme

Praktikum-Meßtechnik Verfasser: Dr. H. Bergelt

Lk Mathematik 12 Analytische Geometrie Arbeitsblatt A.1

Morphologische Bildoperationen

Routing Algorithmen. Begriffe, Definitionen

Entwicklung eines Distanzmaßes zwischen Bildern über dem Modell der Fields of Visual Words

Stefan Schmid TU Berlin & T-Labs, Berlin, Germany. Reduktionen in der Berechenbarkeitstheorie

Vorbereitungsaufgaben

Lösung Aufgabe 19. ( ) = [Mio Euro]. Empirische Varianz s 2 = 1 n

Rechnen mit Vektoren

Kompression und Datenformate. Grundlagen der Bildspeicherung, Kompressionsverfahren, Datenformate

Hauptseminar Autofokus

Bildtransformationen. Geometrische Transformationen Grauwert-Interpolation

Krümmungsapproximation auf 3D-Modellen

Digitale Bildverarbeitung (DBV)

l p h (x) δw(x) dx für alle δw(x).

Vorgehen zur Kalibrierung von Kamerabildern

3. Schnittebenenverfahren

Grundlagen der digitalen Bildverarbeitung / Fortsetzung

Numerisches Programmieren

4.4. Rang und Inversion einer Matrix

ANIMATION - GRUNDLAGEN

Bildverarbeitung und Mustererkennung

Geometrie I. Sebastian Redinger Informatik 2 Programmiersysteme Martensstraße Erlangen

Kompakte Graphmodelle handgezeichneter Bilder

Animation ist das Erzeugen von Filmen mit Hilfe der Computergrafik. Objekte bewegen sich hierbei oder Beleuchtung, Augpunkt, Form,... ändern sich.

Kompakte Graphmodelle handgezeichneter Bilder. Einbeziehung in Autentizierung und Bilderkennung

Lernmaterialblatt Mathematik. Vektorrechnung eine Einführung. Anwendung Mathematik I. Einleitung:

Principal Component Analysis (PCA)

Optimierung. Optimierung. Vorlesung 2 Optimierung ohne Nebenbedingungen Gradientenverfahren Thomas Brox, Fabian Kuhn

(λ Ri I A+BR)v Ri = 0. Lässt sich umstellen zu

Hydrologie und Flussgebietsmanagement

Der Einbau im Auto. Stereo: Beispiel Fahrzeug. Einbau im Rückspiegel Erfassung von. Reichweite: bis 30 m

Kompression und Datenformate. Grundlagen der Bildspeicherung, Kompressionsverfahren, Datenformate

Statistische Verfahren für das Data Mining in einem Industrieprojekt

Grundlagen der Computer-Tomographie

Effekte richtig einsetzen

Definition (Reguläre Ausdrücke) Sei Σ ein Alphabet, dann gilt: (ii) ε ist ein regulärer Ausdruck über Σ.

Zusammenfassung Digitale Bildverarbeitung By Fabian Flohrmann

Suche nach korrespondierenden Pixeln in zwei Bildern

Anleitung: Standardabweichung

GRUNDLAGEN DER INFORMATIONSTECHNIK / TEIL BILDVERARBEITUNG. Übungen

Lage- und Streuungsparameter

Serie 10: Inverse Matrix und Determinante

(7) Normal Mapping. Vorlesung Computergraphik II S. Müller. Dank an Stefan Rilling U N I V E R S I T Ä T KOBLENZ LANDAU

Vektorgeometrie Layout: Tibor Stolz

Das Wort Vektor kommt aus dem lateinischen und heißt so viel wie "Träger" oder "Fahrer".

Geoinformatik I /Geoinformationsysteme

Geometrie. 1 Vektorielle analytische Geometrie der Ebene, Kegelschnitte

Korrelation (II) Korrelation und Kausalität

Technische Beschreibung der akustischen Signalkette

Technische Universität Wien Institut für Computergraphik und Algorithmen Arbeitsbereich für Algorithmen und Datenstrukturen

4 Vorlesung: Matrix und Determinante

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Rabea Haas, Kai Born DACH September 2010

9th NEMO-SpectroNet Collaboration Forum

& sind die Vektorkomponenten von und sind die Vektorkoordinaten von. A x. a) Der Betrag eines Vektors

Domain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing

Lineare Gleichungssysteme mit zwei Variablen

Barcode-Identifikation. Beschriftungserkennung. Aufbau der Barcodes. Barcode-Typen

Kurs zur Ergänzungsprüfung Darstellende Geometrie CAD. Ebenes Zeichnen (2D-CAD) und die ersten Befehle

Vektoren. Kapitel Skalare, Vektoren, Tensoren. 3.2 Vektoren

Jost Reinecke. 7. Juni 2005

TEIL 13: DIE LINEARE REGRESSION

Inhaltsbasierte Bildsuche. Matthias Spiller. 17. Dezember 2004

Polynome Teil V: Elementarsymmetrische Funktionen.

Lineare Gleichungssysteme

2a +2b = a +2b = 38 a +b = 3 2 2a +2b = 6. 4b = 44 b = 11 und a = 8. DF: Arithmetisches Mittel angegeben (FNr 6)

Korrelationsmatrix. Statistische Bindungen zwischen den N Zufallsgrößen werden durch die Korrelationsmatrix vollständig beschrieben:

4. Kapitel 3D Engine Geometry

TEIL 13: DIE EINFACHE LINEARE REGRESSION

Digitale Fotografie und Bildbearbeitung. Susanne Weber 1. Auflage, Dezember mit Photoshop Elements 12 PE-DFBE12

Prof. J. Zhang Universität Hamburg. AB Technische Aspekte Multimodaler Systeme. 6. Januar 2004

Transkript:

4. Segmentierung von Objekten Video - Inhaltsanalyse Stephan Kopf

Inhalt Vorgehensweise Berechnung der Kamerabewegungen zwischen beliebigen Bildern Transformation eines Bildes Hintergrundbilder / Panoramabilder Segmentierung von Objekten Ergebnisse 2

Vorgehensweise (I) Ziel Objekte des Bildvordergrundes ausschneiden (segmentieren) Annahmen Die Bewegung des Objektes unterscheidet sich von der Bewegung des Bildhintergrundes. Es besteht ein deutlicher Helligkeits- oder Farbunterschied zwischen Objekt und Hintergrund. Mindestens die Hälfte der Pixel im Bild gehören zum Bildhintergrund. Die Objektbewegungen sind kontinuierlich. 3

Vorgehensweise (II) Segmentierungsalgorithmus 1. Der Bildhintergrund aller Bilder einer Kameraeinstellung wird deckungsgleich ausgerichtet. Herleitung der Modellparameter zwischen beliebigen Bildern der Kameraeinstellung Transformation eines Bildes 2. Erzeugung eines Hintergrundbildes 3. Segmentierung eines Objektes durch Vergleich der Bilder der Kameraeinstellung mit dem Hintergrundbild 4

Kamerabewegung zwischen beliebigen Bildern (I) Annahme Für zwei aufeinander folgende Bilder i und i+1 einer Kameraeinstellung sind die Parameter des Kameramodells T i,i+1 bekannt. Gesucht Kameramodell zwischen beliebigen Bildern: T i,j Wird ein Bild i mit T i,j transformiert, so ist Bild i passend zu dem Referenzbild j ausgerichtet. Ein Hintergrundbild wird erzeugt, indem jedes Bild i der Kameraeinstellung mit T i,j transformiert wird. 5

Kamerabewegung zwischen beliebigen Bildern (II) Berechnung des Kameramodells T i,i+1 (für i<j) Die Transformationen T i,i+1 sind bekannt. Beliebige Koordinaten (x, y) im Bild i werden ausgewählt und mit T i,i+1 auf die neue Position (x,y ) transformiert. (x, y ) wird mit T i+1,i+2 transformiert und ergibt die Position (x, y ) im Bild i + 2. Der Bewegungsvektor von (x, y) nach (x, y ) entspricht der Verschiebung eines Hintergrundpixels über zwei Bilder. 6

Kamerabewegung zwischen beliebigen Bildern (III) Berechnung des Kameramodells T i,i+1 (für i<j) (Fortsetzung) Vier unterschiedliche Punkte werden mit T i,i+1 und T i+1,i+2 transformiert und ergeben vier Bewegungsvektoren. Vier dieser Vektoren ermöglichen eine eindeutige Berechnung der acht Parameter des Kameramodells T i,i+2. Mit dem gleichen Verfahren können für beliebige Bilder i und j (i< j) alle Transformationen T i,j berechnet werden. 7

Kamerabewegung zwischen beliebigen Bildern (IV) Berechnung des Kameramodells T i,i+1 (für i>j) Um aus der Transformation T i,j die inverse Transformation T j,i abzuleiten, werden vier Bewegungsvektoren von Bild i nach j bestimmt. Die Richtungen der vier Bewegungsvektoren werden umgedreht, d. h. Startpunkte und Endpunkte werden vertauscht. Die vier Vektoren definieren durch Lösen des Gleichungssystems die Transformation T j,i. 8

Transformation eines Bildes (I) Idee Ein beliebiges Bild j der Kameraeinstellung wird als Referenzbild ausgewählt, an dem alle anderen Bilder ausgerichtet werden sollen. Der Bildhintergrund ist deckungsgleich, falls Bild i wird mit T i,j transformiert wird. Bild j 9

Transformation eines Bildes (II) Vorgehensweise bei der Erstellung eines Hintergrundbildes Jedem Pixel des Hintergrundbildes wird ein Pixelwert aus den transformierten Bildern zugeordnet. Die inverse Transformation T j,i liefert ausgehend von der Pixelposition (x, y ) im Hintergrundbild die Position (x, y) im ursprünglichen Bild. Jedem Pixel an der Position (x, y ) im transformierten Bild I wird der Helligkeitswert an der Position (x, y) aus dem ursprünglichen Bild zugewiesen. (x, y) entspricht jedoch nicht genau einer ganzzahligen Pixelposition, sondern wird im Allgemeinen zwischen vier Pixel liegen. ganzzahlige Verschiebung Subpixel-Verschiebung 10

Transformation eines Bildes (III) Lineare Interpolation g x und g y : ganzzahliger Anteil von x bzw. von y Rest: d x := x g x d y := y g y Helligkeit I im transformierten Bild 11

Transformation eines Bildes (IV) Merkmale der linearen Interpolation Je weiter das Pixel (x, y) von einer ganzzahligen Pixelposition entfernt ist, desto größer ist der Einfluss der anderen Pixel auf die Helligkeit des Pixels. Durch die hohe Genauigkeit der Ausrichtung der Bilder mit der linearen Interpolation ist eine exakte Segmentierung von Objekten möglich. Die Unschärfe nimmt bis zu einer Verschiebung von 0,5 Pixel zu (Glättung des Bildes). Für Panoramabilder in hohen Auflösungen sind Unschärfen und fehlerhafte Farben nicht akzeptabel und die Interpolation somit nicht geeignet. Vermeidung von Unschärfe Statt des interpolierten Wertes wird der Helligkeitswert des nächstgelegenen Pixels verwendet. Damit ist der Nachteil verbunden, dass lediglich eine Verschiebung um ganzzahlige Werte möglich ist und die Genauigkeit der Transformation abnimmt. 12

Konstruktion von Hintergrundbildern (I) In einem Hintergrund- oder Panoramabild sollen Vordergrundobjekte nicht oder höchstens einmal enthalten sein. Alle N Bilder einer Kameraeinstellung werden transformiert: Als Auswahl für jedes Pixel im Hintergrundbild stehen bis zu N Pixel aus den transformierten Bildern zur Verfügung. Der Median liefert einen guten Wert für die Hintergrundpixel. 13

Konstruktion von Hintergrundbildern (II) Berechnung des Medians Füge Pixel aller ausgerichteten Bilder an einer Position in Liste ein, sortiere Liste und wähle mittleres Element der Liste als Median aus hoher Rechenaufwand pro Pixel: O (N log N) Verbesserung Erzeuge aus den Pixelwerten an einer Bildposition ein Histogramm. Durchlaufe Histogramm aufsteigend und summiere die Anzahl der Pixel. Der Median entspricht dem Indexeintrag, bei dem die Summe die Hälfte aller Pixel des Histogramms überschreitet. 14

Konstruktion von Hintergrundbildern (III) Annahme Mindestens die Hälfte der Pixel beschreibt den Bildhintergrund Der Median dieser N Helligkeitswerte ist eine gute Heuristik für ein Hintergrundpixel. Problem Objekt bewegt sich so langsam durch das Bild, dass einzelne Objektpixel mehr als die Hälfte der Zeit an einer Pixelposition verweilen. fehlerhafte Bereiche entstehen in den Hintergrundbildern. 15

Konstruktion von Hintergrundbildern (IV) Fehlerhaftes Hintergrundbild bei langsamer Objektbewegung 16

Konstruktion von Hintergrundbildern (V) Verbesserung der Segmentierung durch Differenzbilder Vergleich zweier benachbarter und durch die Transformation entsprechend ausgerichteter Bilder Objektbewegungen führen zu Bildunterschieden in mindestens zwei Regionen Schätzung der Position und Größe des Objektes durch den Schwerpunkt (S x, S y ) der Differenzpixel D (x,y): Festlegung eines Rechtecks um den Schwerpunkt (S x, S y ) abhängig von den Varianzen der Positionen der Differenzpixel. 17

Konstruktion von Hintergrundbildern (VI) 18

Segmentierung von Objekten (I) Der Medianfilter entfernt Objekte des Bildvordergrunds. Die Segmentierung eines Objektes erfolgt durch den Vergleich des transformierten Bildes mit dem Hintergrundbild. Die Position und Form der Objektes im ursprünglichen Bild der Kameraeinstellung wird durch die inverse Transformation ermittelt. Fehler der Segmentierung im Bereich der Objektgrenzen werden durch die morphologischen Operatoren Opening und Closing reduziert. Das größte Objekt wird ausgewählt. Deutliche Kanten in den Randbereichen eines Objektes werden als tatsächliche Objektgrenzen verwendet. 19

Opening / Closing Original Erosion Dilatation Opening Closing Opening: Kleine und schmale Objektregionen werden entfernt. Closing: Löcher werden gefüllt und Lücken zwischen benachbarten Regionen geschlossen. 20

Segmentierung von Objekten (II) Differenzbild nach Anwendung Optimierung der Ränder morphologischer Operatoren 21

Ergebnisse Ursachen für Fehler sehr große Objekte geringe Objektbewegung Objekt nähert sich der Kamera keine markanten Strukturen im Bildhintergrund Schatten eines Objektes Objekt und Hintergrund besitzen identische Helligkeitswerte 22

Beispiele segmentierter Objekte 23

Panoramabilder aus Videos 24

Fragen? 25