OpenCL. OpenCL. Boris Totev, Cornelius Knap

Größe: px

Ab Seite anzeigen:

Download "OpenCL. OpenCL. Boris Totev, Cornelius Knap"

Nikolas Lehmann
vor 7 Jahren
Abrufe

1 OpenCL OpenCL 1

2 OpenCL Gliederung Entstehungsgeschichte von OpenCL Was, warum und überhaupt wieso OpenCL CUDA, OpenGL und OpenCL GPUs OpenCL Objekte Work-Units OpenCL Adressbereiche OpenCL API Codebeispiel 2

3 Entstehungsgeschichte Ursprünglich von Apple Inc. Entwickelt. Apple hält immernoch die Rechte. Zusammenarbeit mit AMD, IBM, Qualcomm Intel, und Nvidia. Apple reicht Vorschlag bei der Khronos Group ein. Am wird die Khronos Compute Working Group gegründet. 3

4 Entstehungsgeschichte stellt die Gruppe die technischen Details der Spezifikation fertig überprüft und genehmigt Khronos die Spezifikation für den public release. OpenCL 1.0 wurde mit Mac OS X Snow Leopard released. 4

5 Was, Warum und Wieso OpenCL Was ist OpenCL OpenCL: Open Computing Language Offene Spezifikation Designed für: Number crunching Parallele Aufgaben, die viel Performance brauchen Da offener Standard kann jeder OpenCL Adaptieren und seine eigen Implementation schreiben. Aber: Muss die Erforderungen der Spezifikationen erfüllen. 5

6 Was, Warum und Wieso OpenCL Wieso OpenCL Man geht weg von Taktrate zu Anzahl Kerne um Leistung zu gewinnen. Früher: Erhöhung der Taktrate Heute: Erhöhung der Anzahl Kerne. 6

7 Was, Warum und Wieso OpenCL Wieso OpenCL Fungiert als Kleber der alle verfügbare Hardware verbindet. Programming Interface das es User erlaubt von allen Systemressourcen Gebrauch machen zu können. Wurde entwickelt um GPGPU zu unterstützen. (General Purpose Computing an Graphics Processing Unit) Wurde entwickelt um GPPC zu unterstützen. (General Purpose Parallel Computing) 7

8 Was, Warum und Wieso OpenCL Wieso OpenCL GPPC, also auch OpenCL Nutzung nicht nur im Grafikbereich einsetzbar. Wird sehr oft zur wissenschaftlichen Berechnungen und Simulationen verwendet. OpenCL ist Hardwareunabhängig. Da offener Standard sollte gleicher Code portabel sein. OpenCL wird nicht von einzige Firma kontrolliert Unabhänging von spezifischen Händler. 8

9 Was, Warum und Wieso OpenCL Ziele von OpenCL Simples Rechenmodell Basiert auf C Dient als Thread management framework. Anwendung und Thread Synchronisation Unterstützt ANSI-C99 Sprachen Dazu zusätzliche Datentypen und eingebaute Funktionen Einfach zu nutzen sollte Leichtgewichtig sein. Sollte in der Lage sein Alle verfügbaren Systemressourcen zu nutzen. Stellt nach IEEE-754 akzeptable Rundungsverhalten 9

10 Was, Warum und Wieso OpenCL OpenCl Geräte Gängige CPUs und GPUs Alle Geräte die konform sind. Multimedia chips FPGA (Field Programmable Gate Array) Embedded Processors 10

11 Was, Warum und Wieso OpenCL Nutzungsbereiche von OpenCl Bilder, Audio, Videoverarbeitung ( Video Rendering ) Simulationen und wissenschaftlichen Berechnungen ( Strömungssimulationen ) Medizinische Bildverarbeitung ( Stresswerte in Organe ) Finanzmodelle erstellen und analysieren. Um Parallele Algorithmen effizient zu berechnen. z.b. Über GPU Clusterfarm Bitcoins farmen. 11

12 Was, Warum und Wieso OpenCL Wo OpenCl nicht verwendet sollte Sequentielle Probleme und Aufgaben Berechnungen die ständig Pointer nachjagen müssen oder ständig Datenpermutatioinen durchführen. Berechnungen die eine Menge von Kommunikation und dadurch resultierende Datenupdates verwenden. 12

13 CUDA, OpenGL und OpenCl OpenCL und OpenGL OpenCL gut zusammen mit OpenGl verwendbar. Daten können zwischen Berechnungen(OpenCl) und Anzeige(OpenGL) getauscht werden. Falls OpenCL auf der GPU angewendet wird sind die Leistung kaum wenn mit OpenGL integriert wurde. 13

14 CUDA, OpenGL und OpenCl CUDA CUDA ist eine extrem mächtige GPGPU Interface Leicht integrierbar in existierenden C/C++ Code Jedoch ist CUDA nicht Hardwareunabhängig Funktioniert nur mit Nvidia Grafikkarten. Im Gegensatz zu OpenCL nicht auf CPUs anwendbar Eigentum von Nvidia und ist closed source. 14

15 GPUs Was sind GPUs GPUs sind unglaublich schnelle floating-point Rechenwerke GPUs sind designed um sehr hoch skalierbare Parellelität bewältigen zu können. 15

16 GPUs Core 2 Duo NVIDIA GT220 16

17 GPUs Limitationen einer GPU System zu GPU Bandbreite ist limitiert durch den PCI Bus GPUs sind zwar unglaublich schnell aber nicht sonderlich klug. Können mit Fehlern schlecht umgehen. GPU Programme können sehr schwer zu debuggen sein. GPUs verlagen, dass ihre Daten in eine bestimmte Reihenfolge angeordnet ist um effizient zu laufen. 17

18 GPUs Wie sieht die Perfomance von OpenCL aus? 18

19 OpenCL Objekte OpenCL Objekte Compute Devices Memory Objekte Arrays Bilder Executable Objekte Compute Programme Compute Kernel 19

20 OpenCL Objekte Compute Devices Ein Prozessor/GPU der Datenparallele Programme ausführt QuadCore CPU 20

21 OpenCL Objekte Compute Devices Eine Device Gruppe kann aus verschiedenen Zusammenstellungen von CPUs und GPUs bestehen. 21

22 OpenCL Objekte Compute Devices. 22

23 OpenCL Objekte Memory Objekte Arrays Funktionieren genau so wie Arrays in C Die Elemente werden mit Pointer addressiert Nur: Array das auf der CPU liest/schreibt ist gecached. Array das auf der GPU liest/schreibt meist nicht. 23

24 OpenCL Objekte Memory Objekte - Bilder Können 2D oder 3D sein Bilderdaten sind in einem optimierten NICHTlinearen Format gespeichert. Zugriff auf einzelne Elemente über Pointer nicht möglich. Beim Einlesen der Daten wird der Texture Cache verwendet. 24

25 OpenCL Objekte Executable Objekte Compute Kernel Jeder Kernel ist designt um in einem Element/Thread/work-item ausgeführt zu werden. 25

26 OpenCL Objekte Executable Objekte Compute Program Eine Gruppe von Kernels und Funktionen. 26

27 Work-Units Work Unit Work-Item Work-Group Work-Item ( CUDA ) = CUDA Thread Work-Group ( CUDA ) = Thread Block 27

28 Work-Units Work Unit Work-Item Work-Group Work-Units können 1, 2 oder 3 Dimensional sein. 28

29 Work-Units Work-Item Identifiers Jedes Work-Item weiß an welches Element von einer Berechnung es gerade arbeitet. Jedes Work-Item & Work-Group kann innerhalb des Kernels identifiziert werden. Die gesamte Reichweite von Work-Items ist als NDRange definiert. 29

30 Work-Units Work-Item Identifiers 30

31 Work-Units Work-Item Identifiers Falls auf GPU und Work-Groups partitioniert dann local_id Sonst global_id X = Dimension Also 0, 1 oder 2 31

32 OpenCL Objekte 32

33 OpenCl Adressbereiche Global Memory Constant Memory Cache RAM von GraKa, Zugriff über global U.A. Texture cache, Zugriff über constant Local Memory Memory von einer Compute Unit, Zugriff über local Fast so schnell wie Register ( 700GB/S ) Private Memory von einem Thread, Zugriff über private 33

34 OpenCL Adressbereiche Die Adressbereiche private CUDA Local local CUDA Shared constant CUDA constant global CUDA global 34

35 OpenCL API 5 Schritte um eine OpenCL Berechnung durchzuführen Initalization Allocate resources Creating programs / kernels Execution Tear down 35

36 Code Beispiel Bearbeitung der Daten eines 2D Arrays auf der GPU Daten können z.b. von einem Bild kommen. 36

37 Code Beispiel Bearbeitung der Daten eines 2D Arrays auf der GPU 37

38 Code Beispiel Initialization 38

39 Code Beispiel Allocation 39

40 Code Beispiel Program / Kernel Creation 40

41 Code Beispiel Execution 41

42 Code Beispiel Tear Down 42

43 Quellen OpenCL reference Page: torials%20-%201&referringtitle=opencl%20tutorials

Ähnliche Dokumente

OpenCL. Programmiersprachen im Multicore-Zeitalter. Tim Wiersdörfer

OpenCL. Programmiersprachen im Multicore-Zeitalter. Tim Wiersdörfer OpenCL Programmiersprachen im Multicore-Zeitalter Tim Wiersdörfer Inhaltsverzeichnis 1. Was ist OpenCL 2. Entwicklung von OpenCL 3. OpenCL Modelle 1. Plattform-Modell 2. Ausführungs-Modell 3. Speicher-Modell