Grafik- Programmierung

Größe: px
Ab Seite anzeigen:

Download "Grafik- Programmierung"

Transkript

1 Grafik- Programmierung Seminar SS08 Thema: Stand der Technik/ Ausblick Moritz Dekorsy

2 Inhaltsverzeichnis 1. Einführung Stand der Technik Unified Shader Vorteile Vergleich der Pipelines Anwendung Die fliegenden Kisten Komplexer: Navier-Stokes Ausblick und Fazit AMD s Fusion Aufbau AMD Fusion Anhang Literaturverzeichnis

3 1. Einführung 1.1 Stand der Technik Der Grafikchip, um den es hier gehen soll, ist der G80 auf der Geforce 8800 Karte. Auf diesem Chip des Grafikprozessorenentwicklers NVIDIA wurde mit der Unified-Shader-Bauweise erstmals eine Technologie eingeführt, die sich stark von der klassischen Shader-Bauweise wie sie auf herkömmlichen Grafikchips Verwendung findet, unterschied. Dieses zur neuesten Technologiegeneration von Grafikchips gehörende damalige (2006) Flaggschiff des Grafikkartenherstellers NVIDIA verfügt über 681 mio. Transistoren in 90nm Fertigungstechnik, d.hh diese befinden sich auf 484 mm 2 Chipfläche. Als verwendete Programmierschnittstelle für die 3D-Grafik kommt Direct3D10 zum Einsatz, das verwendete Modell für die Shader-Architektur ist bereits in der vierten Version. Durch die parallel arbeitenden 128 Streamprozessoren, die jeweils mit einer Frequenz on 1.35 Ghz arbeiten, addiert sich die Rechenleistung zu beeindruckenden 346 GFlop/s. 1.2 Unified Shader Die Unified-Shader, die auf dem G80 erstmals zum Einsatz kommen, stellen eine neue Art von Grafikprozessoren dar, sogenannte Alleskönner im Gegensatz zu den jeweils dedizierten herkömmlichen Shader. Hier folgt eine kurze Wiederholung zu den Shader, um den Übergang von der klassischen diskreten Shader-Architektur zu der Unified Architektur darzulegen: Es gibt drei Arten von Shadern, die Pixel-Shader für allgemeine Berechnungen der Bildpunkte wie die Pixelfarbänderungen und das Hinzufügen von 3D- und Lichteffekten, die Vertex-Shader zur Berechnung und dynamischen Veränderung von Objekten durch Verschiebung der Vertices (der Eckpunkten von dreidimensionalen Objekten), und die Geometry-Shader zur Erzeugung neuer geometrischer Objekte. Diese drei verschiedenen Typen von Shadern wurden wegen ihres jeweils stetig wachsenden Funktionsumfanges und den sich daraus ergebenden Überschneidungen zu einer Unified-Shader-Archtiektur zusammengefasst, bei der Hardwareseitig auf eine Unterscheidung der drei herkömmlichen Shadertypen verzichtet wird. 3

4 Dies hat den Vorteil, das man die Shadereinheiten nicht von vorneherein den jeweiligen Aufgabengebieten Pixel-, Vertex- und Geometrieshading widmet, und sie so möglicherweise bei ungleich verteilten Rechenaufgaben im Leerlauf verbleiben. Dieser Unterschied ist bei den Blockdiagrammen des G70 (Abb.1) und G80 (Abb. 2) zu sehen. Die erste Graphik zeigt den G70/71, bei dem noch diskrete Pixel- und Vertex-Shader existieren, und zwar 8 Vertex-Shader (*) und 24 Pixel- Shader (**). (*) (**) Abb. 1: Blockdiagramm G71 4

5 Die Unified-Shader-Architektur, nach der der G80-Grafikchip aufgebaut ist, fasst also nun die drei herkömmlichen Shadereinheiten zu einer Hardwareeinheit (*) zusammen. [1] (*) Abb. 2: Blockdiagramm G80 Man beachte den Datenfluss. Nachdem der Assembler seine Rechenoperationen durchgeführt hat, erreicht der Datenfluss den Vertex- Prozessor, welcher diesen sooft wie nötig durch die Unified-Shader schickt, bis alle nötigen Berechnungen ausgeführt wurden. Bei den Stream- Prozessoren, von welchen die Unified-Shader des G80 ja 128 Stück enthalten, handelt es es sich im Gegensatz zu älteren Generationen nicht um Vektor-, sondern um Skalarprozessoren, was zunächst sonderbar erscheint angesichts der Tatsache, dass einschlägige Literatur zu 3D-Grafik voll von Matrixberechnungen ist. Der Einsatz von skalaren Stream- Prozessoren jedoch erschafft eine viel effizientere und flexiblere Berechnungsmaschinerie, die gegenüber herkömmlichen Architekturen, bestehend aus vier Blöcken zu jeweils 32 dedizierten Prozessoren um den Geschwindigkeitsfaktor 2 übertrifft. 5

6 1.3 Vorteile Der Vorteil dieser Bauweise zeigt sich insbesondere, bei folgendem Anwendungsbeispiel, einmal auf der klassischen und einmal auf der neuen Architektur veranschaulicht: Hat man beispielsweise eine Szene (Abb. 3) bestehend aus vielen einzelnen zu berechnenden Vertices und wenigen Pixeln, Abb. 3: Szene mit vielen Vertices so verteilt sich die Rechenlast auf einem Chipsatz klassischer Bauweiser, wie bei diesem fiktiven mit einer festen Anzahl von 4 Vertex Shader- Einheiten und 8 Pixel-Shader-Einheiten, nicht ihren Anteilen entsprechend auf die Shadereinheiten, sondern die fest vorgegebene Anzahl an Pixel-, Vertex- und Geometrieshadern ist dafür verantwortlich, dass im Normalfall immer einige bis viele Shadereinheiten ungenutzt bleiben, während deren Rechenleistung an anderer Stelle fehlt. [2] Abb. 4: Szene mit vielen Pixeln Analoges gilt für Szenen bestehend aus vielen zu berechnenden Pixeln (Abb. 4), hier kommt es ebenso zu einer unsymmetrischen Auslastung der Shader, also zu einer ineffizienten Auslastung des Chipsatzes. 6

7 Die Unified Architektur ermöglicht nun, im entgegengesetzten Fall zu alten Chipsatzarchitekturen die Rechenlast zu Gunsten der Performance dynamisch auf die Streamprozessoren verteilt werden (Abb. 5 & 6): Abb. 5 Hierbei kommt es nun zu einer optimalen Auslastung von 12 der fiktiven 12 Shadereinheiten, da sowohl Pixel- als auch Vertexoperationen ausgeführt werden können. Abb. 6 7

8 1.4 Vergleich der Pipelines Veranschaulichen wir uns noch einmal das klassische Modell einer 3D- Pipeline (Abb. 7), wie sie in den letzten 20 Jahren eingesetzt worden ist: Der Datenfluss beginnt ganz oben, wo Vertices mit den verschiedenen Indizes, Kommandos und Texturen der GPU von der CPU übergeben werden. Dann müssen die Vertices die einzelnen Shader und anderen Verarbeitungsstufen eins nach dem anderen durchlaufen, bis sie in den Speicher geschrieben werden können. [3] Transform and Lightning --> vertex shading Dreiecks,-Punkt- und Linienoperationen Shading, Texturierung, Pixelshading Blending, Z-buffering, antialiasing breitbandiger und schneller mit der Zeit Abb. 7: 3D-Pipeline 8

9 Bei der Unified Pipeline und Shader Architektur des GeForce 8800 Designs konnte die Anzahl der zu durchlaufenden Verarbeitungsstufen drastisch gesenkt werden. Berechnungen, die mehrere Verarbeitungsstufen benötigen, können immer wieder, aber jeweils nur bei Bedarf, die Shader-Einheiten durchlaufen. 1.5 Unified Design Schematisch lässt sich das Unified Design (Abb. 8) folgendermassen darstellen: Die zu verarbeitenden Daten werden an den Eingangspuffer des Chips geschickt (im Bild links), werden von dem unified-shader-kern verarbeitet und von dieser aus über den Ausgangspuffer zurück an den Eingangspuffer geschickt, wo sie ihrer jeweiligen Verarbeitungsstufe entsprechend weiter berechnet werden. Dieser Vorgang wird genauso oft wiederholt, bis alle Operationen abgeschlossen sind und das Objekt (Vertex, Polygon) an das ROP-Subsystem (Raster-Operations) weitergegeben wird. Abb. 8: Unified Design 9

10 Als Konsequenz dieser neuartigen Architektur (Abb 9), die zu einer enormen Leistungssteigerung und Entlastung damit auch für den Hauptprozessor geführt hat, erschliessen sich einige neue Aufgabengebiete für die sogenannten Unified Stream Prozessoren, wie das sogenannte Geometry-Shading oder physikalische Berechnungen, auf die ich hier noch näher eingehen will. Abb. 9: Unified Pipeline 10

11 2. Anwendung 2.1. Die fliegenden Kisten Ein einfaches Beispiel für solche parallelen Rechenoperationen ist die Berechnung von fliegenden Kisten (vielen gleichartigen Objekten). Ziel ist es, die Positionen dieser fliegenden Objekte zu bestimmen. Dafür benötigen wir die jeweilige alte Position, die Geschwindigkeit der Box und die Zeit. Die Strecke, die ein Objekt zurücklegt, hängt von der Geschwindigkeit und der Zeit wie folgt ab: s = v t Deshalb werden die neuen Positionen der Kisten berechnet nach: P P 1 n = P2 = = P 1old P P 2 old nold v 1 v v 2 n t t t Die serielle CPU würde nun immer nur eine Gleichung auf einmal berechnen können (viell. zwei oder vier mit einem Mehrkern Prozessor). 11

12 Abb. 10: CPU-Rechenschema 1 Ausserdem operiert sie aus dem Cache heraus und benötigt deshalb eine grosse, komplexe Kontrolllogik. Dieses Design wäre zur Berechnung reichlich ineffizient, wollte man viele dieser identischen Gleichungen möglichst gleichzeitig berechnen, da eine herkömmliche CPU eben nicht dafür ausgelegt ist, viele ähnliche Berechnungen bzw. Gleichungen simultan auszuführen bzw. zu lösen. Die GPGPU würde dieses Aufgabe hingegen deutlich schneller bewältigen können, aufgrund ihrer parallel aufgebauten Art. Die einzelnen Shader würden die Gleichungen simultan lösen und können darüber hinaus Informationen über den Grafikspeicher austauschen. Dabei werden diese simultan mittels Streaming befüllt. Abb. 11: GPU-Rechenschema 1 : ALU: Arithmetisch logische Kontrolleinheit 12

13 2.2 Komplexer: Navier-Stokes Was dieses stark vereinfachte Beispiel nicht berücksichtigt ist die Notwendigkeit, dass die einzelnen Threads (Ausführungsstränge) untereinander kommunizieren müssen, was jedoch nur auf Hardware möglich ist, die dem DirectX 10 Standard genügt. Man überlege sich beispielsweise die Simulation von untereinander wechselwirkenden Teilchen, wie zum Beispiel den Teilchen einer Strömung, einer Flüssigkeit oder eines Gases. [6] Ein solche Simulation wird realisiert durch die Berechnung eines Gleichungssystemes (viele ähnliche Gleichungen) welches aus der Navier- Stokes-Gleichung folgt: u t ρ ρ 1 = ( u ) u p + v ρ 2 u + F Hierbei ist u ρ das Geschwindigkeitsfeld (Abb. 12), p das Druckfeld, v die Viskosität (Zähheit) des Fluids, ρ die Dichte und F = (fx, fy) eine beliebige externe Kraft, welche auf das Fluid wirkt. Abb. 12: Geschwindigkeitsvektorfeld eines Fluids 13

14 Dieses Gleichungssystem bezieht den Einfluss aller benachbarten Teilchen bei der Berechnung eines jeden einzelnen mit ein. Nur dadurch, dass (wie es bei DirectX 10 der Fall ist) der Output als kontinuierlicher Datenstrom erfolgt, ist es möglich, dass alle diese Berechnungen parallel ausgeführt werden. Dabei wird der von den Streamprozessoren gemeinsam benutzte Speicher zur Interprozesskommunikation genutzt, was sich ebenfalls als gewaltiger Vorteil eben dieser Architektur erweist. 3. Ausblick und Fazit 3.1 AMD s Fusion Aufgrund der immer weiter wachsenden Fähigkeiten und Eignungen der GPU s, deren stetig steigender Rechenleistung und Fähigkeit, auch immer allgemeinere Aufgaben zu übernehmen, drängt sich den Chiparchitekten nun natürlich der Gedanke auf, die sich immer ähnlicher werdenden GPU und CPU in einem Chip, auf einer Matrix zu vereinigen. Denn Aufgrund der sehr ähnlichen Anforderungen dieser an ein System wie der Tatsache, dass es sich bei beiden um Processing Units (PUs) handelt, müssen beide mit großer Bandbreite und hoher Geschwindigkeit auf den Speicher zugreifen, wobei geringe Latenzen eine wichtige Rolle spielen und für beide es von Vorteil ist, auf viele Transistoren zurückgreifen zu können, bot sich dei Entwicklung eines Projektes zur Vereinigung von CPU und GPU an. AMD, der Chipfabrikant hat sich 2006 mit ATI, dem Grafikkartenhersteller zusammengeschlossen. Aus dieser Fusion auf Unternehmensebene soll nun eine auf der der Chipsätze entstehen, mit ebenjenem Namen, AMD-Fusion. (ist der Codename). 14

15 3.2 Aufbau AMD Fusion An einem weiteren Blockdiagramm (Abb.13) lässt sich die Architektur dieses neuartigen Prozessorkombinates veranschaulichen: Abb. 13: Blockdiagramm AMD Fusion Man erhofft sich von dieser Vereinigung Vorteile wie den schnelleren Speicherzugriff des GPU-Kerns auf den Arbeitsspeicher über den Prozessorsockel ( da dieser mit höherer Bandbreite an diesen angeschlossen ist als die PCI-e - oder AGP Schnittstelle, einen schnelleren Informationsaustausch zwischen CPU & GPU-Kernen, da Cache der CPU mit dem Buffer der GPU direkt über den hier zu sehenden Crossbar-Switch verbunden ist (geringere Latenzen sind die Folge), sowie ein besseres Rechenleistungs zu Watt Verhältnis (sprich: Stromeinsparungen) im Vergleich zu diskreten Systemen; Zielanwendungen sind natürlich in der Mobilsparte zu suchen. 15

16 3.3 Fazit Es ist zu abzusehen, dass der Geschwindigkeitsvorteil von GPU Implementierungen solcher Verfahren gegenüber seriellen Prozessoren immer größer wird. Für Simulationen bei denen die Genauigkeitsanforderungen nicht so hoch sind wie beispielsweise die die Darstellungen von Strömungen oder Partikelschwärmen in Filmen werden sie bereits heute eingesetzt. Falls sich jedoch der Trend der sich stetig verbessernden Fleißkommagenauigkeit und Speichererweiterung fortsetzt, so ist die Verwendung von GPGPUs für physikalisch korrekte Simulationen abzusehen, so z.b. im Fahrzeugbau. 4. Anhang 4.1 Literaturverzeichnis [1] NVIDIA: GeForce 8800 GPU Architecture Technical Brief 2007 [2] Jim Van Verth: Physical Simulation on GPUs 2007 [3] Phil Hester: Unleashing the Processing Powerhouse 2007 [4] Sarah Tariq and Ignacio Llamas (NVIDIA Developer Technology): Real-Time Volumetric Smoke, Fire and Water with Fluid Dynamics 2007 [5] Sarah Tariq and Ignacio Llamas (NVIDIA Developer Technology): Real-Time Volumetric Smoke using D3D [6] Alexander Podlich und Jens Wollenhaupt: GPGPU Strömungssimulation 2006 [7] Irma Sejdic, Dominik Erdmann, Daniel Wilhelm & Christoph Kurz: Partikelsysteme & Schwärme

RST-Labor WS06/07 GPGPU. General Purpose Computation On Graphics Processing Units. (Grafikkarten-Programmierung) Von: Marc Blunck

RST-Labor WS06/07 GPGPU. General Purpose Computation On Graphics Processing Units. (Grafikkarten-Programmierung) Von: Marc Blunck RST-Labor WS06/07 GPGPU General Purpose Computation On Graphics Processing Units (Grafikkarten-Programmierung) Von: Marc Blunck Ablauf Einführung GPGPU Die GPU GPU Architektur Die Programmierung Programme

Mehr

Untersuchung und Vorstellung moderner Grafikchiparchitekturen

Untersuchung und Vorstellung moderner Grafikchiparchitekturen Fakultät Informatik, Institut für Technische Informatik, Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur Untersuchung und Vorstellung moderner Grafikchiparchitekturen Hauptseminar Technische

Mehr

Grafikkarten-Architektur

Grafikkarten-Architektur > Grafikkarten-Architektur Parallele Strukturen in der GPU Name: Sebastian Albers E-Mail: s.albers@wwu.de 2 > Inhalt > CPU und GPU im Vergleich > Rendering-Pipeline > Shader > GPGPU > Nvidia Tesla-Architektur

Mehr

Cell and Larrabee Microarchitecture

Cell and Larrabee Microarchitecture Cell and Larrabee Microarchitecture Benjamin Grund Dominik Wolfert Universität Erlangen-Nürnberg 1 Übersicht Einleitung Herkömmliche Prozessorarchitekturen Motivation für Entwicklung neuer Architekturen

Mehr

Architektur moderner GPUs. W. Sczygiol - M. Lötsch

Architektur moderner GPUs. W. Sczygiol - M. Lötsch Architektur moderner GPUs W. Sczygiol - M. Lötsch Überblick Chipentwicklung Aktuelle Designs Nvidia: NV40 (ATI: R420) Vertex-Shader Pixel-Shader Shader-Programmierung ROP - Antialiasing Ausblick Referenzen

Mehr

GPGPU Basiskonzepte. von Marc Kirchhoff GPGPU Basiskonzepte 1

GPGPU Basiskonzepte. von Marc Kirchhoff GPGPU Basiskonzepte 1 GPGPU Basiskonzepte von Marc Kirchhoff 29.05.2006 GPGPU Basiskonzepte 1 Inhalt Warum GPGPU Streams, Kernels und Prozessoren Datenstrukturen Algorithmen 29.05.2006 GPGPU Basiskonzepte 2 Warum GPGPU? Performance

Mehr

Thema: Hardware-Shader

Thema: Hardware-Shader Seminar Grafikprogrammierung Thema: Hardware-Shader Christian Bauer 03.07.08 Überblick Entwicklung Die Shader im Detail Programmierung GPGPU Zusammenfassung & Ausblick 1/19 Entwicklung (1) Früher: Berechnung

Mehr

Grundlagen der Spieleprogrammierung

Grundlagen der Spieleprogrammierung Grundlagen der Spieleprogrammierung Teil I: 3D-Graphik Kapitel 8: Hardware Peter Sturm Universität Trier Outline 1. Übersicht und Motivation 2. Mathematische Grundlagen 3. Das Ideal: Photorealistisch (Raytracing,

Mehr

Compute Unified Device Architecture CUDA

Compute Unified Device Architecture CUDA Compute Unified Device Architecture 06. Februar 2012 1 / 13 Gliederung 2 / 13 : Compute Unified Device Architecture entwickelt von Nvidia Corporation spezifiziert Software- und Hardwareeigenschaften Ziel:

Mehr

Rheinisch-Westfälische Technische Hochschule Aachen. Seminararbeit

Rheinisch-Westfälische Technische Hochschule Aachen. Seminararbeit Rheinisch-Westfälische Technische Hochschule Aachen Seminararbeit Analyse von General Purpose Computation on Graphics Processing Units Bibliotheken in Bezug auf GPU-Hersteller. Gregori Kerber Matrikelnummer

Mehr

Diplomarbeit. Neue Möglichkeiten durch programmierbare Shader. Unter der Leitung von: Prof. Dr.-Ing. Detlef Krömker

Diplomarbeit. Neue Möglichkeiten durch programmierbare Shader. Unter der Leitung von: Prof. Dr.-Ing. Detlef Krömker Diplomarbeit 5HDO7LPH6SHFLDO (IIHFWV Neue Möglichkeiten durch programmierbare Shader Unter der Leitung von: Prof. Dr.-Ing. Detlef Krömker Betreut von: Paul Grimm, Ralf Dörner Beginn: 01.04.02 Abgabe: 30.09.02

Mehr

Einführung. GPU-Versuch. Andreas Schäfer Friedrich-Alexander-Universität Erlangen-Nürnberg

Einführung. GPU-Versuch. Andreas Schäfer Friedrich-Alexander-Universität Erlangen-Nürnberg GPU-Versuch andreas.schaefer@cs.fau.de Friedrich-Alexander-Universität Erlangen-Nürnberg Praktikum Parallele Rechnerarchitekturen SS2014 Outline 1 Einführung 2 Outlook 1 Einführung 2 Eine kurze Geschichte

Mehr

CUDA. Moritz Wild, Jan-Hugo Lupp. Seminar Multi-Core Architectures and Programming. Friedrich-Alexander-Universität Erlangen-Nürnberg

CUDA. Moritz Wild, Jan-Hugo Lupp. Seminar Multi-Core Architectures and Programming. Friedrich-Alexander-Universität Erlangen-Nürnberg CUDA Seminar Multi-Core Architectures and Programming 1 Übersicht Einleitung Architektur Programmierung 2 Einleitung Computations on GPU 2003 Probleme Hohe Kenntnisse der Grafikprogrammierung nötig Unterschiedliche

Mehr

Spezialprozessoren zur Übernahme Grafik-spezifischer Aufgaben, vorrangig der Bildschirmausgabe

Spezialprozessoren zur Übernahme Grafik-spezifischer Aufgaben, vorrangig der Bildschirmausgabe Grafikprozessoren Spezialprozessoren zur Übernahme Grafik-spezifischer Aufgaben, vorrangig der Bildschirmausgabe 2D: Berechnung der Bildes aus einfachen Grafikprimitiven 3D: Bildaufbau aus räumlicher Beschreibung

Mehr

Physikalische Berechnungen mit General Purpose Graphics Processing Units (GPGPUs)

Physikalische Berechnungen mit General Purpose Graphics Processing Units (GPGPUs) Fakultätsname XYZ Fachrichtung XYZ Institutsname XYZ, Professur XYZ Physikalische Berechnungen mit General Purpose Graphics Processing Units (GPGPUs) im Rahmen des Proseminars Technische Informatik Juni

Mehr

General Purpose Computation on GPUs

General Purpose Computation on GPUs General Purpose Computation on GPUs Matthias Schneider, Robert Grimm Universität Erlangen-Nürnberg {matthias.schneider, robert.grimm}@informatik.stud.uni-erlangen.de M. Schneider, R. Grimm 1 Übersicht

Mehr

Seminar: Grafikprogrammierung

Seminar: Grafikprogrammierung Game Developer Converence 08 Seminar: Grafikprogrammierung Alexander Weggerle 17.04.08 Seite 2 Einführung Themenüberblick Organisatorisches Seminarablauf liches Seite 3 Einführung Seminar Motivation Vorbereitung

Mehr

Computer Graphics Shader

Computer Graphics Shader Computer Graphics Shader Sven Janusch Inhalt Fixed Function Pipeline Programmable Pipeline Implementierung Applikation Beispiel Sven Janusch 2 Fixed Function Pipeline T&L Pipeline (Transformation and Lighting)

Mehr

Gliederung. Was ist CUDA? CPU GPU/GPGPU CUDA Anwendungsbereiche Wirtschaftlichkeit Beispielvideo

Gliederung. Was ist CUDA? CPU GPU/GPGPU CUDA Anwendungsbereiche Wirtschaftlichkeit Beispielvideo Gliederung Was ist CUDA? CPU GPU/GPGPU CUDA Anwendungsbereiche Wirtschaftlichkeit Beispielvideo Was ist CUDA? Nvidia CUDA ist eine von NvidiaGPGPU-Technologie, die es Programmierern erlaubt, Programmteile

Mehr

PhysX Evaluation. Softwarepraktikum Computergraphik. Daniel Brock, Robert Kreuzer, Simon Kufner. 5. Juli 2010

PhysX Evaluation. Softwarepraktikum Computergraphik. Daniel Brock, Robert Kreuzer, Simon Kufner. 5. Juli 2010 PhysX Evaluation Softwarepraktikum Computergraphik Daniel Brock, Robert Kreuzer, Simon Kufner 5. Juli 2010 Daniel Brock, Robert Kreuzer, Simon Kufner () PhysX Evaluation 5. Juli 2010 1 / 17 1 Aufgabenstellung

Mehr

Georg Molzer 1HDD 3D-Grafikkarten GDV-Hardware

Georg Molzer 1HDD 3D-Grafikkarten GDV-Hardware 3D-GRAFIKKARTEN Einleitung: 3D-Grafikkarten haben in erster Linie den Zweck, den Hauptprozessor beim Darstellen aufwendiger dreidimensionaler Szenarien zu entlasten. Sie übernehmen dabei einen Großteil

Mehr

Shader. Computer Graphics: Shader

Shader. Computer Graphics: Shader Computer Graphics Computer Graphics Shader Computer Graphics: Shader Inhalt Pipeline Memory Resources Input-Assembler Vertex-Shader Geometry-Shader & Stream-Output Rasterizer Pixel-Shader Output-Merger

Mehr

GPU Programmierung 6. Juli 2004 M. Christen, T. Egartner, P. Zanoni

GPU Programmierung 6. Juli 2004 M. Christen, T. Egartner, P. Zanoni GPU Programmierung 6. Juli 2004 M. Christen, T. Egartner, P. Zanoni 1 Ablauf GPU Programm Vertex und Fragment Shader 2 3 4 5 Image Processing 6 Ablauf GPU Programm Ablauf GPU Programm Vertex und Fragment

Mehr

Yilmaz, Tolga MatNr: Mesaud, Elias MatNr:

Yilmaz, Tolga MatNr: Mesaud, Elias MatNr: Yilmaz, Tolga MatNr: 157317 Mesaud, Elias MatNr: 151386 1. Aufbau und Funktionsweise einer Grafikkarte 2. CPU vs. GPU 3. Software 4. Beispielprogramme Kompilierung und Vorführung 5. Wo wird Cuda heutzutage

Mehr

Motivation (GP)GPU CUDA Zusammenfassung. CUDA und Python. Christian Wilms. Integriertes Seminar Projekt Bildverarbeitung

Motivation (GP)GPU CUDA Zusammenfassung. CUDA und Python. Christian Wilms. Integriertes Seminar Projekt Bildverarbeitung CUDA und Python Christian Wilms Integriertes Seminar Projekt Bildverarbeitung Universität Hamburg WiSe 2013/14 12. Dezember 2013 Christian CUDA und Python 1 Gliederung 1 Motivation 2 (GP)GPU 3 CUDA 4 Zusammenfassung

Mehr

Aktuelle Grafikleistungen

Aktuelle Grafikleistungen Aktuelle Grafikleistungen Alexander Hötzendorfer Universität Ulm 03. Juli 2007 Inhalt Übersicht Aktuelle Techniken HDR-Lighting Tessellation Aufbau der Rendering-Pipeline Shader Vertex-Shader Geometry-Shader

Mehr

GPGPU-Architekturen CUDA Programmiermodell Beispielprogramm. Einführung CUDA. Ralf Seidler. Friedrich-Alexander-Universität Erlangen-Nürnberg

GPGPU-Architekturen CUDA Programmiermodell Beispielprogramm. Einführung CUDA. Ralf Seidler. Friedrich-Alexander-Universität Erlangen-Nürnberg Einführung CUDA Friedrich-Alexander-Universität Erlangen-Nürnberg PrakParRA, 18.11.2010 Outline 1 GPGPU-Architekturen 2 CUDA Programmiermodell 3 Beispielprogramm Outlook 1 GPGPU-Architekturen 2 CUDA Programmiermodell

Mehr

Wiederholung. Vorlesung GPU Programmierung Thorsten Grosch

Wiederholung. Vorlesung GPU Programmierung Thorsten Grosch Wiederholung Vorlesung Thorsten Grosch Klausur 2 Zeitstunden (26.7., 8:30 10:30 Uhr, G29/307) Keine Hilfsmittel Kein Bleistift / Rotstift verwenden 3 Aufgabentypen Wissensfragen zur Vorlesung (ca. 1/3)

Mehr

Multicore-Architekturen

Multicore-Architekturen Universität Erlangen- Nürnberg Technische Universität München Universität Stuttgart Multicore-Architekturen Vortrag im Rahmen der Ferienakademie 2009 Kurs 1: Programmierkonzepte für Multi-Core Rechner

Mehr

PG 471: Beyond Graphics. Strömungssimulation in der GPU

PG 471: Beyond Graphics. Strömungssimulation in der GPU Strömungssimulation in der GPU Betreuer: Claus-Peter Alberts, LS VII Dominik Göddeke, LS III (Mathematik) Normale Nutzung von Grafikkarten Normale Nutzung von Grafikkarten STATTDESSEN: GPGPU! Anwendungsfall:

Mehr

Geometry Shader. Ausarbeitung im Rahmen des Seminars Echtzeit Rendering" Von Sebastian Jackel Franz Peschel. Geometry Shader 1

Geometry Shader. Ausarbeitung im Rahmen des Seminars Echtzeit Rendering Von Sebastian Jackel Franz Peschel. Geometry Shader 1 Geometry Shader Ausarbeitung im Rahmen des Seminars Echtzeit Rendering" Von Sebastian Jackel Franz Peschel Geometry Shader 1 Inhalt I Einführung II Facts Renderpipeline III Funktionsweise Geometry Shader

Mehr

Volumenakquise. Vortrag von Benjamin Gayer

Volumenakquise. Vortrag von Benjamin Gayer 10.11.11 1 Volumenakquise Vortrag von Benjamin Gayer Einführung Bildquelle: http://www.medical.siemens.com/siemens/de_de/rg_marcom_fbas/files/patienteninformationen/ct_geschichte_technologie. pdf 10.11.11

Mehr

Computergrafik Universität Osnabrück, Henning Wenke,

Computergrafik Universität Osnabrück, Henning Wenke, Computergrafik Universität Osnabrück, Henning Wenke, 2012-05-14 Kapitel V: Modeling Transformation & Vertex Shader 5.1 Vertex Definitionen: Vertex Vertex Computergrafik Mathematischer Punkt auf einer Oberfläche

Mehr

OEM Hardware Nr. : PCI\VEN_10DE&DEV_05E2&SUBSYS_ &REV_A1

OEM Hardware Nr. : PCI\VEN_10DE&DEV_05E2&SUBSYS_ &REV_A1 SiSoftware Sandra Grafikkarte Display : \\.\DISPLAY1 VGA-kompatibel : Nein Windowsgerätename : NVIDIA GeForce GTX 260 OEM Hardware Nr. : PCI\VEN_10DE&DEV_05E2&SUBSYS_00000000&REV_A1 OEM Gerätename : nvidia

Mehr

Interaktive Globale Beleuchtung nach dem Antiradiance-Verfahren mittels der Open Computing Language (OpenCL)

Interaktive Globale Beleuchtung nach dem Antiradiance-Verfahren mittels der Open Computing Language (OpenCL) Interaktive Globale Beleuchtung nach dem Antiradiance-Verfahren mittels der Open Computing Language (OpenCL) Verteidigung der Belegarbeit Andreas Stahl Zielstellung Globales Beleuchtungsverfahren für die

Mehr

Eine Einführung in die Architektur moderner Graphikprozessoren

Eine Einführung in die Architektur moderner Graphikprozessoren Eine Einführung in die Architektur moderner Graphikprozessoren Seminarvortrag von Sven Schenk WS 2005/2006 Universität Mannheim, Lehrstuhl für Rechnerarchitektur Inhalt Historische Eckpunkte Einführung

Mehr

Stream Processing und High- Level GPGPU Sprachen

Stream Processing und High- Level GPGPU Sprachen Stream Processing und High- Level GPGPU Sprachen Seminar Programmierung von Grafikkarten Jens Breitbart Problem 5000% 4000% 3000% 2000% Rechenleistung: +71% pro Jahr Bandbreite: +25% pro Jahr Zugriffszeit:

Mehr

SS08, LS12, Friedrich-Alexander-Universität Erlangen Florian Hänel, Frederic Pollmann HS Multicore Architectures and Programming GPU EVOLUTION

SS08, LS12, Friedrich-Alexander-Universität Erlangen Florian Hänel, Frederic Pollmann HS Multicore Architectures and Programming GPU EVOLUTION SS08, LS12, Friedrich-Alexander-Universität Erlangen Florian Hänel, Frederic Pollmann HS Multicore Architectures and Programming GPU EVOLUTION (until Geforce 7 Series) 1 ÜBERSICHT Grafikpipeline Verlagerung

Mehr

2 Rechnerarchitekturen

2 Rechnerarchitekturen 2 Rechnerarchitekturen Rechnerarchitekturen Flynns Klassifikation Flynnsche Klassifikation (Flynn sche Taxonomie) 1966 entwickelt, einfaches Modell, bis heute genutzt Beschränkung der Beschreibung auf

Mehr

Eine kurze Einführung in Rechnerarchitektur und Programmierung von Hochleistungsrechnern als zentrales Werkzeug in der Simulation

Eine kurze Einführung in Rechnerarchitektur und Programmierung von Hochleistungsrechnern als zentrales Werkzeug in der Simulation Eine kurze Einführung in Rechnerarchitektur und Programmierung von Hochleistungsrechnern als zentrales Werkzeug in der Simulation Dr. Jan Eitzinger Regionales Rechenzentrum (RRZE) der Universität Erlangen-Nürnberg

Mehr

LEISTUNGSVERGLEICH VON FPGA, GPU UND CPU FÜR ALGORITHMEN ZUR BILDBEARBEITUNG PROSEMINAR INF-B-610

LEISTUNGSVERGLEICH VON FPGA, GPU UND CPU FÜR ALGORITHMEN ZUR BILDBEARBEITUNG PROSEMINAR INF-B-610 LEISTUNGSVERGLEICH VON FPGA, GPU UND CPU FÜR ALGORITHMEN ZUR BILDBEARBEITUNG PROSEMINAR INF-B-610 Dominik Weinrich dominik.weinrich@tu-dresden.de Dresden, 30.11.2017 Gliederung Motivation Aufbau und Hardware

Mehr

Praxiseinheit: Realisierung einer hardwarebeschleunigten Disparitätenberechnung zur automatischen Auswertung von Stereobildern

Praxiseinheit: Realisierung einer hardwarebeschleunigten Disparitätenberechnung zur automatischen Auswertung von Stereobildern Praxiseinheit: Realisierung einer hardwarebeschleunigten Disparitätenberechnung zur automatischen Auswertung von Stereobildern Institut für Betriebssysteme und Rechnerverbund TU Braunschweig 25.10., 26.10.

Mehr

Ansätze 4. GPU. Echtzeit- Raytracing. Polygon- Rendering. Computerspiele Sommer (c) 2013, Peter Sturm, Universität Trier 1

Ansätze 4. GPU. Echtzeit- Raytracing. Polygon- Rendering. Computerspiele Sommer (c) 2013, Peter Sturm, Universität Trier 1 4. GPU Ansätze Echtzeit- Raytracing Modell und Materialeigenschaften auf Raytracer Kontinuierliche Darstellung Polygon- Rendering CPU wählt darzustellende Polygone aus Render Pipeline (c) 2013, Peter Sturm,

Mehr

Parallele Algorithmen in der Bildverarbeitung

Parallele Algorithmen in der Bildverarbeitung Seminar über Algorithmen - SoSe 2009 Parallele Algorithmen in der Bildverarbeitung von Christopher Keiner 1 Allgemeines 1.1 Einleitung Parallele Algorithmen gewinnen immer stärker an Bedeutung. Es existieren

Mehr

General-purpose computing on GPUs

General-purpose computing on GPUs Seminar Multiprocesser on Chip Seminararbeit General-purpose computing on GPUs Institut für Informatik Universität Potsdam eingereicht von: Michael Winkelmann (738901) Sommersemester 2010 Zusammenfassung

Mehr

Numerik und Rechnen. Inhaltsverzeichnis. Seminar Programmierung von Grafikkarten

Numerik und Rechnen. Inhaltsverzeichnis. Seminar Programmierung von Grafikkarten Numerik und Rechnen Seminar Programmierung von Grafikkarten Martin Heide & Dominik Holler Betreuer: Björn Knafla, Prof. Dr. Claudia Leopold Inhaltsverzeichnis 1 Einführung...2 2 Rechnen auf der GPU mit

Mehr

3D-Grafik-Chips. Informatik-Seminar Michael R. Albertin. Betreuer: E. Glatz

3D-Grafik-Chips. Informatik-Seminar Michael R. Albertin. Betreuer: E. Glatz 3D-Grafik-Chips Informatik-Seminar Michael R. Albertin Betreuer: E. Glatz Übersicht Übersicht Ziel Einleitung Chipgrundlagen Funktionen Benchmarks Schluss Ziel Grundlegende Techniken kennen Chips unterscheiden

Mehr

Grafikprozessor Grafikspeicher Taktung Kühlung Schnittstellen Ausgänge Treiber Crossfire & SLI ATI Nvidia Matrox PowerVR Technologies Inhaltsverzeichn

Grafikprozessor Grafikspeicher Taktung Kühlung Schnittstellen Ausgänge Treiber Crossfire & SLI ATI Nvidia Matrox PowerVR Technologies Inhaltsverzeichn Grafikprozessor Grafikspeicher Taktung Kühlung Schnittstellen Ausgänge Treiber Crossfire & SLI ATI Nvidia Matrox PowerVR Technologies Inhaltsverzeichnis Grafikprozessor Der Grafikprozessor dient zur Berechnung

Mehr

Fachgebiet Programmiermethodik Prof. Dr. Claudia Leopold. Seminar Programmierung von Grafikkarten. GPGPU Basiskonzepte. von.

Fachgebiet Programmiermethodik Prof. Dr. Claudia Leopold. Seminar Programmierung von Grafikkarten. GPGPU Basiskonzepte. von. Fachgebiet Programmiermethodik Prof. Dr. Claudia Leopold Seminar Programmierung von Grafikkarten GPGPU Basiskonzepte von Marc Kirchhoff Inhaltsverzeichnis 1 Einleitung 2 2 Streams, Kernels und Prozessoren

Mehr

CPU, GPU und FPGA. CPU, GPU und FPGA Maximilian Bandle, Bianca Forkel 21. November 2017

CPU, GPU und FPGA. CPU, GPU und FPGA Maximilian Bandle, Bianca Forkel 21. November 2017 CPU, GPU und FPGA, Bianca Forkel 21. November 2017 CPU, GPU und FPGA Inhalt CPU: Central Processing Unit GPU: Graphical Processing Unit FPGA: Field Programmable Gate Array 2 CPU Central Processing Unit

Mehr

Prozessor- und Rechnerarchitekturen (Master)

Prozessor- und Rechnerarchitekturen (Master) Prozessor- und Rechnerarchitekturen (Master) Themen am 31.05.17: Was ist ein Grafik-Chip? Was soll berechnet werden? Warum kann das keine Standard-CPU machen?? ProRecArc17_V8 Ulrich Schaarschmidt HS Düsseldorf,

Mehr

Maximale Power mit der neuen ERAZER Gaming Notebook-Linie von MEDION

Maximale Power mit der neuen ERAZER Gaming Notebook-Linie von MEDION Maximale Power mit der neuen ERAZER Gaming Notebook-Linie von MEDION ERAZER Gaming-Notebooks mit 15 - oder 17 -Displays überzeugen mit Intel Core Prozessoren, NVIDIA GeForce Grafik und mechanischem Keyboard

Mehr

Seminar Multicore-Programmierung

Seminar Multicore-Programmierung Multicore- und GPGPU-Architekturen Fakultät für Informatik und Mathematik Universität Passau 04. November 2010 APUs / 1 / 39 Inhaltsverzeichnis I APUs / APUs / 2 / 39 Inhaltsverzeichnis II APUs / 3 / 39

Mehr

OpenCL. Programmiersprachen im Multicore-Zeitalter. Tim Wiersdörfer

OpenCL. Programmiersprachen im Multicore-Zeitalter. Tim Wiersdörfer OpenCL Programmiersprachen im Multicore-Zeitalter Tim Wiersdörfer Inhaltsverzeichnis 1. Was ist OpenCL 2. Entwicklung von OpenCL 3. OpenCL Modelle 1. Plattform-Modell 2. Ausführungs-Modell 3. Speicher-Modell

Mehr

Paralleler Cuckoo-Filter. Seminar: Implementierungstechniken für Hauptspeicherdatenbanksysteme Jeremias Neth München, 21.

Paralleler Cuckoo-Filter. Seminar: Implementierungstechniken für Hauptspeicherdatenbanksysteme Jeremias Neth München, 21. Paralleler Cuckoo-Filter Seminar: Implementierungstechniken für Hauptspeicherdatenbanksysteme Jeremias Neth München, 21. November 2017 1 Paralleler Cuckoo-Filter Cuckoo-Hashtabelle Serieller Cuckoo-Filter

Mehr

Vorlesung Rechnerarchitektur. Einführung

Vorlesung Rechnerarchitektur. Einführung Vorlesung Rechnerarchitektur Einführung Themen der Vorlesung Die Vorlesung entwickelt an Hand von zwei Beispielen wichtige Prinzipien der Prozessorarchitektur und der Speicherarchitektur: MU0 Arm Speicher

Mehr

Spieleprogrammierung mit DirectX und C++

Spieleprogrammierung mit DirectX und C++ Ulrich Kaiser, Philipp Lensing Spieleprogrammierung mit DirectX und C++ 2D-, 3D- und Netzwerkspiele, viele Spezialeffekte Galileo Press Einleitung 11 Danksagung 13 Vorwort zur zweiten Auflage 14 1 Vorbereitung

Mehr

OpenGL und die Fixed-Function-Pipeline

OpenGL und die Fixed-Function-Pipeline OpenGL und die Fixed-Function-Pipeline Proseminar Game Design WS 07/08 Jan-Hendrik Behrmann Einführung In modernen Computerspielen hat sich inzwischen die Darstellung der Spielwelt in dreidimensionaler

Mehr

GPGPU mit NVIDIA CUDA

GPGPU mit NVIDIA CUDA 01.07.12 GPGPU mit NVIDIA CUDA General-Purpose on Formatvorlagecomputing des Graphics Processing durch Units Untertitelmasters mit KlickenCompute bearbeiten NVIDIA Unified Device Architecture Gliederung

Mehr

N Bit Binärzahlen. Stelle: Binär-Digit:

N Bit Binärzahlen. Stelle: Binär-Digit: N Bit Binärzahlen N Bit Binärzahlen, Beispiel 16 Bit: Stelle: 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 Binär-Digit: 0 0 1 0 1 0 0 1 1 1 0 0 1 0 0 0 Least Significant Bit (LSB) und Most Significant Bit (MSB)

Mehr

Vorlesung Mathematik 2 für Informatik

Vorlesung Mathematik 2 für Informatik Vorlesung Mathematik für Informatik Inhalt: Lineare Algebra Rechnen mit Vektoren und Matrizen Lineare Gleichungssysteme, GauÿAlgorithmus Vektorräume, Lineare Abbildungen Eigenwerte und Eigenvektoren Literatur

Mehr

Refactoring the UrQMD Model for Many- Core Architectures

Refactoring the UrQMD Model for Many- Core Architectures Refactoring the UrQMD Model for Many- Core Architectures Mathias Radtke Semiar: Softwaretechnologie (WS 2013/2014 Goethe-Universität Frankfurt Agenda: 1. UrQMD 2. CPU Vs. GPU 3. Von FORTRAN zu C++/OpenCL

Mehr

Ein kleiner Einblick in die Welt der Supercomputer. Christian Krohn 07.12.2010 1

Ein kleiner Einblick in die Welt der Supercomputer. Christian Krohn 07.12.2010 1 Ein kleiner Einblick in die Welt der Supercomputer Christian Krohn 07.12.2010 1 Vorschub: FLOPS Entwicklung der Supercomputer Funktionsweisen von Supercomputern Zukunftsvisionen 2 Ein Top10 Supercomputer

Mehr

Lineare Algebra. Inhalt. Hauptbestandteil der Vorlesung Mathematik 2 Literatur: Teschl/Teschl, Band 1, Kap. 9-14

Lineare Algebra. Inhalt. Hauptbestandteil der Vorlesung Mathematik 2 Literatur: Teschl/Teschl, Band 1, Kap. 9-14 Lineare Algebra Hauptbestandteil der Vorlesung Mathematik Literatur: Teschl/Teschl, Band, Kap. 9-4 Inhalt Rechnen mit Vektoren und Matrizen Lineare Gleichungssysteme, GauÿAlgorithmus Vektorräume, Lineare

Mehr

Vertiefungsrichtung Rechnerarchitektur

Vertiefungsrichtung Rechnerarchitektur srichtung () ( für ) Prof. Dietmar Fey Ziele der srichtung RA Vertiefen des Verständnis vom Aufbau, Funktionsweise von Rechnern und Prozessoren Modellierung und Entwurf von Rechnern und Prozessoren ()

Mehr

Interaktives Wasser in 3D. Jörn Loviscach Hochschule Bremen

Interaktives Wasser in 3D. Jörn Loviscach Hochschule Bremen Interaktives Wasser in 3D Jörn Loviscach Hochschule Bremen Ringwellen (Kapillar- und Schwerewellen) Kelvin-Schiffswellen Reflexionen von Himmel (Frensel-Effekt) und Sonne Kaustiken mit korrekten Schatten

Mehr

Die Sandy-Bridge Architektur

Die Sandy-Bridge Architektur Fakultät Informatik - Institut für Technische Informatik - Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur Die Sandy-Bridge Architektur René Arnold Dresden, 12. Juli 2011 0. Gliederung 1.

Mehr

Strömungssimulation. Alexander Podlich & Jens Wollenhaupt {podlich, Sommersemester

Strömungssimulation. Alexander Podlich & Jens Wollenhaupt {podlich, Sommersemester Strömungssimulation Alexander Podlich & Jens Wollenhaupt {podlich, jewollen}@student.uni-kassel.de Sommersemester 2006 03.07.2006 Übersicht 1. Allgemeines über 2. Das Lattice-Boltzmann Modell 3. Umsetzung

Mehr

GPGPU-Architekturen CUDA Programmiermodell Beispielprogramm Organiosatorisches. Tutorial CUDA. Ralf Seidler

GPGPU-Architekturen CUDA Programmiermodell Beispielprogramm Organiosatorisches. Tutorial CUDA. Ralf Seidler Friedrich-Alexander-Universität Erlangen-Nürnberg 05.10.2010 Outline 1 GPGPU-Architekturen 2 CUDA Programmiermodell 3 Beispielprogramm 4 Organiosatorisches Outlook 1 GPGPU-Architekturen 2 CUDA Programmiermodell

Mehr

Eine kurze Geschichte der Grafikkarten

Eine kurze Geschichte der Grafikkarten 3.1 Einführung Eine kurze Geschichte der Grafikkarten ursprünglich: Graphics Card steuert Monitor an Mitte 80er: Grafikkarten mit 2D-Beschleunigung angelehnt an Arcade- und Home-Computer frühe 90er: erste

Mehr

Echtzeitfähige hige Verfahren in der Computergrafik. Lehrstuhl für f r Informatik Computer Grafik und Visualisierung TUM

Echtzeitfähige hige Verfahren in der Computergrafik. Lehrstuhl für f r Informatik Computer Grafik und Visualisierung TUM Echtzeitfähige hige Verfahren in der Computergrafik Prof. Dr. Rüdiger R Westermann Lehrstuhl für f r Informatik Computer Grafik und Visualisierung TUM Lehr- und Forschungsinhalte Visualisierung Darstellung

Mehr

PRIP-Preis. Effizientes Object Tracking durch Programmierung von Mehrkernprozessoren und Grafikkarten

PRIP-Preis. Effizientes Object Tracking durch Programmierung von Mehrkernprozessoren und Grafikkarten Masterarbeit @ PRIP-Preis Effizientes Object Tracking durch Programmierung von Mehrkernprozessoren und Grafikkarten Michael Rauter Pattern Recognition and Image Processing Group Institute of Computer Aided

Mehr

Masterpraktikum Scientific Computing

Masterpraktikum Scientific Computing Masterpraktikum Scientific Computing High-Performance Computing Thomas Auckenthaler Wolfgang Eckhardt Technische Universität München, Germany Outline Entwicklung General Purpose GPU Programming (GPGPU)

Mehr

Übersicht. Vergleich der Spielekonsole mit dem PC. Historie der Spielekonsolen von 1976 bis 1999

Übersicht. Vergleich der Spielekonsole mit dem PC. Historie der Spielekonsolen von 1976 bis 1999 Übersicht Vergleich der Spielekonsole mit dem PC Historie der Spielekonsolen von 1976 bis 1999 Heutige Generation der Konsolen Überblick Vergleich der PS2 mit der XBox Ausblick auf die kommende Konsolengeneration

Mehr

Masterpraktikum Scientific Computing

Masterpraktikum Scientific Computing Masterpraktikum Scientific Computing High-Performance Computing Thomas Auckenthaler Wolfgang Eckhardt Prof. Dr. Michael Bader Technische Universität München, Germany Outline Organisatorisches Entwicklung

Mehr

Seminar: Multi-Core Architectures and Programming

Seminar: Multi-Core Architectures and Programming Seminar: Multi-Core Architectures and Programming Parallelisierung des Viola-Jones Algorithmus auf Tilera Hardware-Software-Co-Design Universität Erlangen-Nürnberg 1 Übersicht Einleitung Erste Versuche

Mehr

Neue Grafikkarten: Tipps, Tests, Techniken

Neue Grafikkarten: Tipps, Tests, Techniken Neue : Tipps, Tests, Techniken GS, GT, GTS, Pro oder XT: Dieser Artikel erklärt die wichtigsten Fachbegriffe und hilft Ihnen, die Leistung einer Grafikkarte selbst zu beurteilen. Plus: alle aktuellen Grafikchips

Mehr

technische universität dortmund Lehrstuhl für Hochfrequenztechnik Übertragungssysteme

technische universität dortmund Lehrstuhl für Hochfrequenztechnik Übertragungssysteme Lehrstuhl für Hochfrequenztechnik GPU-beschleunigte numerische Simulation faseroptischer Übertragungssysteme, Marius Helf, Peter Krummrich Übersicht Motivation Split-Step p Fourier Methode Ansätze für

Mehr

Strömungssimulation Seminar Programmierung von Grafikkarten Universität Kassel

Strömungssimulation Seminar Programmierung von Grafikkarten Universität Kassel Strömungssimulation Seminar Programmierung von Grafikkarten Universität Kassel Alexander Podlich und Jens Wollenhaupt {podlich, jewollen}@student.uni-kassel.de 16. Juli 2006 Inhaltsverzeichnis 1 Einleitung

Mehr

Seminar Parallele Rechnerarchitekturen SS04 \ SIMD Implementierung aktueller Prozessoren 2 (Dominik Tamm) \ Inhalt. Seite 1

Seminar Parallele Rechnerarchitekturen SS04 \ SIMD Implementierung aktueller Prozessoren 2 (Dominik Tamm) \ Inhalt. Seite 1 \ Inhalt Seite 1 \ Inhalt SIMD Kurze Rekapitulation 3Dnow! (AMD) AltiVec (PowerPC) Quellen Seite 2 \ Wir erinnern uns: Nach Flynn s Taxonomie kann man jeden Computer In eine von vier Kategorien einteilen:

Mehr

PCI Express 3.0 Features and Highspeed Switching / Interconnect

PCI Express 3.0 Features and Highspeed Switching / Interconnect PCI Express 3.0 Features and Highspeed Switching / Interconnect Präsentation von Conrad Sachweh Gliederung 1. Was ist PCIe 2. PCIe 3.0 Features 3. Switches 4. Fazit Präsentation von Conrad Sachweh 2 1.

Mehr

Im Bereich der Entwicklung und Herstellung von Prozessoren spielen

Im Bereich der Entwicklung und Herstellung von Prozessoren spielen Prozessor (CPU) Allgemeines, Begriffe, Entwicklung Der Prozessor ist heutzutage das Herzstück fast eines jeden elektronischen Geräts. Er ist ein hochkomplexer Chip, der mit feinsten Halbleiterstrukturen

Mehr

Evolution of GPUs. Die Entwicklung der Graphics Processing Units. Marvin Kampf und Michael Moese. Seminar: Multi-Core Architectures and Programming

Evolution of GPUs. Die Entwicklung der Graphics Processing Units. Marvin Kampf und Michael Moese. Seminar: Multi-Core Architectures and Programming Evlutin f GPUs Die Entwicklung der Graphics Prcessing Units Marvin Kampf und Michael Mese Seminar: Multi-Cre Architectures and Prgramming Was bedeutet Entwicklung hin zur GPU? Hinzufügen vn Prgrammierbarkeit

Mehr

GPGPU WITH OPENCL. Praktikum Parallele Rechnerarchitekturen, 2015w Franz Richter-Gottfried

GPGPU WITH OPENCL. Praktikum Parallele Rechnerarchitekturen, 2015w Franz Richter-Gottfried GPGPU WITH OPENCL Praktikum Parallele Rechnerarchitekturen, 2015w Franz Richter-Gottfried INFRASTRUCTURE Enqueue interactive job srun --gres --pty bash Graphics cards available for tesla_k20,

Mehr

Multicore und mobile, stromsparende Anwendungen ein Widerspruch? Hubert Hafner Product Marketing

Multicore und mobile, stromsparende Anwendungen ein Widerspruch? Hubert Hafner Product Marketing Multicore und mobile, stromsparende Anwendungen ein Widerspruch? Hubert Hafner Product Marketing Winterthur, September 2010 Agenda Über Kontron Anforderungen der mobilen Welt Aktuellen Atom -Techniken

Mehr

1 Einleitung. 2 Parallelisierbarkeit von. Architektur

1 Einleitung. 2 Parallelisierbarkeit von. Architektur Beschleunigung von Aufgaben der parallelen Bildverarbeitung durch Benutzung von NVIDIA-Grafikkarten mit der Compute Unified Device Architecture (CUDA) Roman Glebov roman@glebov.de Abstract Diese Arbeit

Mehr

Interaktive Visualisierung zeitabhängiger Volumendaten

Interaktive Visualisierung zeitabhängiger Volumendaten Interaktive Visualisierung zeitabhängiger Volumendaten Diplomarbeit von Dario Kardas graphische datenverarbeitung, universität erlangen-nürnberg Skalare Volumendaten Volumen besteht aus Schichtbildern

Mehr

Spielst du noch oder rechnest du schon?

Spielst du noch oder rechnest du schon? Spielst du noch oder rechnest du schon? Mit Spielkonsole und Co. zum Supercomputer der Zukunft Fachbereich Elektrotechnik und Informationstechnik Fachhochschule Bielefeld University of Applied Sciences

Mehr

Computer - Aufbau u. Funktionsweise

Computer - Aufbau u. Funktionsweise Teil 3 Folie: 1 Ein Computerarbeitsplatz Teil 3 Folie: 2 Was ist in der Box? Hauptplatine, Motherboard Das Bussystem Teil 3 Folie: 3 Unter einem Bussystem (oder kurz einem Bus) versteht man bei einem PC

Mehr

GPU Programmierung. Thorsten Grosch

GPU Programmierung. Thorsten Grosch Thorsten Grosch Willkommen zur ersten Vorlesung! g Heute Organisatorisches Vorstellung von Team und Vorlesung Historischer Rückblick zu GPUs 2 Das Team Vorlesung Jun.-Prof. Thorsten Grosch AG Computervisualistik

Mehr

Hyrican CyberGamer. Stark. Effizient. Kostengünstig. Finden Sie Ihr ideales Design

Hyrican CyberGamer. Stark. Effizient. Kostengünstig. Finden Sie Ihr ideales Design Hyrican CyberGamer Stark. Effizient. Kostengünstig. Finden Sie Ihr ideales Design Beim neuen Hyrican CyberGamer haben Sie die Wahl: Ob Forest, Desert oder Black die Designs bestechen durch eine Einzigartigkeit,

Mehr

CUDA. Jürgen Pröll. Multi-Core Architectures and Programming. Friedrich-Alexander-Universität Erlangen-Nürnberg Jürgen Pröll 1

CUDA. Jürgen Pröll. Multi-Core Architectures and Programming. Friedrich-Alexander-Universität Erlangen-Nürnberg Jürgen Pröll 1 CUDA Jürgen Pröll Multi-Core Architectures and Programming Jürgen Pröll 1 Image-Resize: sequentiell resize() mit bilinearer Interpolation leicht zu parallelisieren, da einzelne Punkte voneinander unabhängig

Mehr

Hardware-unabhängige Beschleunigung von Medizinischer Bildverarbeitung mit OpenCL

Hardware-unabhängige Beschleunigung von Medizinischer Bildverarbeitung mit OpenCL Hardware-unabhängige Beschleunigung von Medizinischer Bildverarbeitung mit OpenCL Christian Siegl 1, Hannes G. Hofmann 1, Benjamin Keck 1, Marcus Prümmer 1, Joachim Hornegger 1,2 1 Lehrstuhl für Mustererkennung,

Mehr

Shader kreativ Scharfe Texturen, Bewegungsunschärfe und Stofffalten Jörn Loviscach Hochschule Bremen jlovisca@informatik.hs-bremen.de www.l7h.cn Einführung Standardanwendungen für aktuelle Grafikhardware:

Mehr

3D Rendering mit PHP. Die neue PEAR-Klasse Image_3D bietet die Möglichkeit nur mit PHP5 3DGrafiken zu rendern

3D Rendering mit PHP. Die neue PEAR-Klasse Image_3D bietet die Möglichkeit nur mit PHP5 3DGrafiken zu rendern 3D Rendering mit PHP Die neue PEAR-Klasse Image_3D bietet die Möglichkeit nur mit PHP5 3DGrafiken zu rendern Speaker Kore Nordmann Studiert Informatik an der Universität Dortmund Arbeitet als Software

Mehr

KALAHA. Erfahrungen bei der Implementation von neuronalen Netzen in APL. Dipl.Math. Ralf Herminghaus, April 2018

KALAHA. Erfahrungen bei der Implementation von neuronalen Netzen in APL. Dipl.Math. Ralf Herminghaus, April 2018 KALAHA Erfahrungen bei der Implementation von neuronalen Netzen in APL Dipl.Math. Ralf Herminghaus, April 2018 1. Die Schlagzeile 2. Die Idee APL ist eine Super-Sprache! Also: So schwierig kann das ja

Mehr

Beleuchtung Schattierung Rasterung

Beleuchtung Schattierung Rasterung Beleuchtung Schattierung Rasterung Thomas Jung t.jung@htw-berlin.de Beleuchtung, Schattierung und Rasterung in allen Echtzeit-3D-Umgebungen gleich OpenGL Direct3D 3dsmax,... Letzter Bestandteil der Grafikpipeline

Mehr

Hochleistungsrechnen auf dem PC

Hochleistungsrechnen auf dem PC Hochleistungsrechnen auf dem PC Steffen Börm Christian-Albrechts-Universität zu Kiel Ringvorlesung Informatik, 26. Juni 2014 S. Börm (CAU Kiel) Hochleistungsrechnen auf dem PC 26. Juni 2014 1 / 33 Übersicht

Mehr

Die Welt der Shader. Fortgeschrittene Techniken III

Die Welt der Shader. Fortgeschrittene Techniken III Die Welt der Shader Fortgeschrittene Techniken III Universität zu Köln WS 14/15 Softwaretechnologie II (Teil 1) Prof. Dr. Manfred Thaller Referent: Lukas Kley Gliederung 1. Was ist ein Shader? 2. Verschiedene

Mehr

MSI Dragon Edition. Das must have für MSI-Fans und anspruchsvolle Gamer. Erwecke den Drachen!

MSI Dragon Edition. Das must have für MSI-Fans und anspruchsvolle Gamer. Erwecke den Drachen! MSI Dragon Edition Das must have für MSI-Fans und anspruchsvolle Gamer Erwecke den Drachen! Die neuen Dragon-Edition-PCs sehen nicht nur stark aus, sondern sind das ultimative must have für MSI-Fans sowie

Mehr