Enblend - Portierung auf die GPU

Größe: px

Ab Seite anzeigen:

Download "Enblend - Portierung auf die GPU"

Elke Heinrich
vor 5 Jahren
Abrufe

1 Multi-Core Architectures and Programming Enblend - Portierung auf die GPU Hardware/Software Co-Design September 25,

2 Inhalt 1 Motivation 2 Enblend-Algorithmus 3 Beschleunigung mittels Cuda 4 Benchmark 5 Ausblick 2

3 Motivation 3

4 Programmablauf Transition Line Gaussian Pyramid Laplacian Pyramid Blending Collapsing 4

5 Transition Line Finden einer Übergangslinie zwischen zwei Einzelbildern, die * im Schnittbereich der Bilder liegt * möglichst weit entfernt von den Kanten dieses Bereichs ist Verwendeter Algorithmus basiert auf Nearest Feature Transform Verschiedene weitere Optimierungsstrategien werden angewendet Dient als Vorlage für Blending-Mask, welche * in Bereichen hoher Frequenzen einen harten Übergang besitzt * in Bereichen tiefer Frequenzen einen weichen Übergang besitzt 5

6 Transition Line - Beispiel 6

7 Gaussian Pyramid Anwendung auf beide Teilbilder und die zuvor generierte Blending-Mask N Stufen der Pyramide werden durch Unterabtastung der vorherigen Stufe erzeugt zusätzliche Tiefpassfilterung der Bilder Verwendung der einzelnen Stufen im nächsten Schritt g 0 = IMAGE g L = REDUCE [g L 1], mit 0 < L < N 7

8 Gaussian Pyramid - Beispiel 8

9 Laplacian Pyramid Laplacepyramidenebenen werden über die Bildung der Differenz von zwei benachbarten Gaußpyramidenebenen erzielt Hochskalierung und Interpolation der jeweils niedrigeren Stufe vor der Differenzbildung Oberste Pyramidenebene enthält nur höchsten Frequenzen im Bild, alle weiteren Stufen jeweils geringere Frequenzbänder Letzte Stufe enthält unterste Gaußpyramidenstufe L L = g L EXPAND[g L + 1], mit 0 L < N 9

10 Laplacian Pyramid - Beispiel 10

11 Blending Zusammenführen der Einzelbilder anhand der Blending-Mask Anwendung einzeln auf jede Stufe der Laplacepyramide Maske gibt Gewichtung der Einzelbilder für jedes Pixel vor B L = (1 M L ) L L,image1 + M L L L,image2 11

12 Blending - Beispiel 12

13 Collapsing Zusammenfügung der Frequenzbänder zum Endergebniss Hochskalieren und Interpolation der jeweils niedrigeren Stufe und Addition zur aktuellen Stufe C L = B L + EXPAND[B L+1 ] 13

14 Collapsing - Beispiel 14

15 Umsetzung mit Cuda Gaussian Pyramid Laplacian Pyramid Blending Collapsing 15

16 Gaussian, Laplacian Pyramid - Cuda vom Original-Projekt verwendeter Algorithmus ist optimiert auf sequentielle Ausführung, jedes Pixel wird nur ein mal gelesen bzw. beschrieben für Grafikkarte nicht geeignet Berechnung der Zielpixel parallel Anwendung einer Filtermaske zur Tiefpassfilterung / Interpolation Interpolationsfiltermatrix Tiefpassfiltermatrix 16

17 Blending, Collapsing - Cuda Auch hier Original-Algorithmus für sequentielle Abarbeitung optimiert Laden der Einzelbilder und Maske in Texturen, parallele Berechnung des Ergebnisbildes global void blending(float4 *dst, int w, int h) { const int ix = blockdim.x * blockidx.x + threadidx.x; const int iy = blockdim.y * blockidx.y + threadidx.y; if(ix<w && iy<h) { float4 image1 = tex1dfetch(tex_image, ix + iy * w); float4 image2 = tex1dfetch(tex_image2, ix + iy * w); float4 mask = tex1dfetch(tex_image3, ix + iy * w); } } dst[w * iy + ix].x = mask.x/255.0 * image2.x + ( mask.x)/255.0 * image1.x; dst[w * iy + ix].y = mask.y/255.0 * image2.y + ( mask.y)/255.0 * image1.y; dst[w * iy + ix].z = mask.z/255.0 * image2.z + ( mask.z)/255.0 * image1.z; 17

18 Benchmark 18

19 Transition Line - parallel In [1] paralleler Nearest Feature Transform Algorithmus vorgeschlagen Voraussichtlich höherer Speedup möglich 19

20 Quellen [1] Marina L. Gavrilova and Muhammad H. Alsuwaiyel. Two Algorithms for Computing the Euclidean Distance Transform. [2] ( ) [3] P. Burt and E. Adelson. The Laplacian Pyramid as a Compact Image Code. 20

Ähnliche Dokumente

CUDA. Moritz Wild, Jan-Hugo Lupp. Seminar Multi-Core Architectures and Programming. Friedrich-Alexander-Universität Erlangen-Nürnberg

CUDA. Moritz Wild, Jan-Hugo Lupp. Seminar Multi-Core Architectures and Programming. Friedrich-Alexander-Universität Erlangen-Nürnberg CUDA Seminar Multi-Core Architectures and Programming 1 Übersicht Einleitung Architektur Programmierung 2 Einleitung Computations on GPU 2003 Probleme Hohe Kenntnisse der Grafikprogrammierung nötig Unterschiedliche