Multiskalenanalyse Any view depends on the viewpoint!
Multiskalenanalyse Motivation Aufwandsminimierung bei Filterung Objekterkennung, Segmentierung Textur Klassifikation Mosaicing
rundlagen Signaltheorie Wellenlänge Ortsfrequenz λ f f = 1 λ die Anzahl der Wiederholungen einer periodischen Struktur wird als Wellenzahlindex u bezeichnet die maximale Wellenzahl, die bei einer gegebenen Abtastrate fehlerfrei rekonstruiert werden kann, heißt renzwellenzahl u max
rundlagen Signaltheorie die kleinste im Bild darstellbare periodische Struktur hat die röße λ min = 2Pixel 1 1 fmax = = Wellen pro Pixel λ 2 min in einem 256x256 Bild kann sich eine periodische Struktur höchstens 128 wiederholen u =, u 1 max 128 min =
Abtasttheorem Abtasttheorem f sample 2 f max Die Abtastfrequenz muß mind. doppelt so groß sein, wie die größte im Bild vorkommende Frequenz Doppelt Abtastfequenz ist notwendig, aber nicht hinreichende Bedingung
Multi-Resolution Analysis
auß Pyramide Motivation viele Anwendungen erfordern die Zerlegung eines zu analysierenden Bildes in seine Frequenzanteile Fourier-Transformation erlaubt keine Zuordnung von Frequenzanteilen zu Strukturen im Ortsbereich man benötigt eine Darstellungsform im Ortsbereich, die ein Bild in mehrere Frequenzbereiche aufspaltet
auß Pyramide Motivation mittels eines REDUCE Operators wird die obere Hälfte der Anteile des Frequenzspektrums eines Bildes herausgefiltert, und das Bild in Zeilen- und Spaltenrichtung gleichzeitig um die Hälfte verkleinert Tiefpaßfilterung Verkleinerung Informationsverlust! iterativer Fortsetzung dieses Vorganges erzeugt eine auß-pyramide
auß Pyramide Motivation 7 6 5 4 3 Stufe Zeilen/Spalten Wellenzahlindizes 0 256 1-128 1 128 1-64 2 64 1-32 3 32 1-16 4 16 1-8 5 8 1-4 6 4 1-2 7 2 1 2 1 0
auß Pyramide Iterativer Algorithmus 0 i = S ( ), i= 0, K, 1 + 1= REDUCE i r Blockdiagramm 0 = S 1 2 r 1 Reduce Reduce Reduce r
auß Pyramide Beispiel 3 6 7 5 4 2 1 = S 0
auß Pyramide um die einzelnen Ebenen der Pyramide vergleichen zu können, ist es notwendig, mit einer EXPAND-Operation eine Ebene auf die röße der nächst größeren Ebene zu vergrößern i,1 i,2 i, i = EXPAND = EXPAND = M EXPAND ( ) i,0 ( ) i,1 ( ) i, i 1 mit i,0 = i
auß Pyramide = S 0 1, 1 2, 2 3,3 4, 4 5, 5
Laplace Pyramide speichert Bildinformation, die durch eine REDUCE-Operation entfernt werden ist definiert durch die Differenz zweier auß- Ebenen L L i r r ( ) = i EXPAND i+ 1 = i,0 i+ 1, 1 für i= 0, K, r 1 = hat Bandpass-Character
Laplace Pyramide 1 2 r 1 r 0 L 0 + _ Reduce Reduce Reduce Expand + L 1 _ Expand + L r 1 _ Expand Stufe Zeilen/Spalten Wellenzahlindizes L0 256 65-128 L1 128 33-64 L2 64 17-32 L3 32 9-16 L4 16 5-8 L5 8 3-4 L6 4 1-2 L7 2 1 L r
Laplace Pyramide L 3 L L 6 5 4 L L 7 = 7 L 2 L 1 L 0
Laplace Pyramide L0 L1, 1 L 2, 2 L3,3 L4, 4 L 5, 5
auss & Laplace Pyramiden
Rücktransformation aus der Laplace Pyramide kann das Originalbild iterativ rekonstruiert werden Ebenen der auß Pyramide werden nicht benötigt S r r i 1 = Li 1+ EXPAND( i) für i= r, r 1, K, 1 = = L 0 L 0 L 1 L r 1 + + + S= Expand 0 + Expand + 1 2 r 1 + Expand L r
Reduce Operator Vereinigung einer lättungsoperation Tiefpaßfilterung mit einem Filterkern H rößenreduktionsoperation g 0 nur jeder zweite Bildpunkt wird Mittelpunkt der lättungsoperation ( x, y) = 0 + 2 = S + 2 u= 2v= 2 = s( x, y) gi+ 1( x, y) = h(2+ u,2+ v) g i (2x+ u,2y+ v) x = 0, K,2 r ( i+ 1) ; y = 0, K,2 r ( i+ 1) ; i = 0, K, r 1
Reduce Operator h = ( c b a b c ) c b a b c c b a b c c b a b c ungerade Pixel gerade Pixel
Expand Operator Inverse Operation zur REDUCE Operation Vereinigung einer Interpolationsoperation rößenexpansionsoperation ewichtung der Interpolation muß vervierfacht werden (Verdoppelung der röße in Zeilen- und Spaltenrichtung) g i, k + 1( x, y) = 4 h(2+ u,2+ v) g x y + 2 + 2 u= 2v= 2 = 0,1, K,2 = 0,1, K,2 i= 1,2, K, r k = 0,1, K, i r ( i 1) + k r ( i 1) + k i, k x+ u y+ v, 2 2
Expand Operator h = 2 ( c b a b c ) 2b 2b 2c 2a 2c 2b 2b 2b 2b 2c 2a 2c 2b 2b 2b 2b 2c 2a 2b 2b 2c ungerade Pixel gerade Pixel
Filterkern Anforderungen h u, v = h u h v H ist symmetrisch h ˆ ( u) = h ˆ ( v) = ( c b a b c ) H ist normiert a+ 2 b+ 2 c= 1 jeder Bildpunkt einer Ebene i leistet zu den Bildpunkten der Ebene i+1 denselben Beitrag H ist separabel ( ) ( ) ( ) b c b a b c b a + 2 c= 2 b a+ 2 c 2 b gerade Bildpunkte ungerade Bildpunkte
Filterkern Beispiel 5x5 Filterkern a+ 2b+ 2c a+ 2c = 2b = 1 a b c = = frei 1 1 4 4 wählbar a 2 Binomenialfilter außfilter 2 a= 5 3 a= 8 ˆ= 1 h ( 1 4 6 41) 16 1 h ˆ= ( 15 8 51) 20
Filterkern Frequenzverhalten Frequenzbereiche der auß- und Laplace Pyramide beruhen auf theoretischen Überlegungen der Filterkern H ist nur eine Approximation eines Idealen Tiefpaßfilters Aliasingeffekte bei bestimmten periodischen Bildstrukturen freier Parameter a bestimmt das reale Frequenzverhalten
Filterkern a = 0.1 a = 0.4 a = 0.7 Idealer Tiefpaß
Mosaicing Klebe -- Bilder S a und S b mit unterschiedlichem Inhalt zusammen ohne die Nahtstelle zu sehen Blurring der Nahtstelle unzureichend Lösung: Berechne Laplace Pyramiden L a und L b Kombiniere die gewünschten Ausschnitte beider Pyramiden Nahtstelle: Mittelung aus L a und L b
Mosaicing S a S b 1/2 S a + 1/2 S b 1/2 S b + 1/2 S a
Mosaicing Maske S a = 0, S b = 1, Nahtstelle = 2 Kein Tiefpass beim Maskenbild M, nur rössenreduktion (a = 1, b = c = 0) l gi l (, ),falls g m (x,y) = 0 ai x y lai ( x, y) + lbi ( x, y) ( x, y) =,falls g m (x,y) = 2 2 lbi ( x, y),falls g m(x,y) = 1
Mosaicing S a S b M =
Mosaicing