SS08, LS12, Friedrich-Alexander-Universität Erlangen Florian Hänel, Frederic Pollmann HS Multicore Architectures and Programming GPU EVOLUTION
|
|
- Theresa Reuter
- vor 7 Jahren
- Abrufe
Transkript
1 SS08, LS12, Friedrich-Alexander-Universität Erlangen Florian Hänel, Frederic Pollmann HS Multicore Architectures and Programming GPU EVOLUTION (until Geforce 7 Series) 1
2 ÜBERSICHT Grafikpipeline Verlagerung der Berechnung von CPU auf GPU Shadermodel 3.0 Architektur nvidia NV40 im Detail 2
3 GRAFIKPIPELINE (1) Was haben wir? Geometrie beschrieben durch Dreiecke bzw. deren Eckpunkte Attribute der Eckpunkte für visuelle Eigenschaften wie Farbe, Lichteinfall usw. Texturen liefern visuelle Details 3
4 GRAFIKPIPELINE (2) Wo wollen wir hin? Monitore sind Rasterdisplays Diskretisierung durch feste Anzahl an Pixeln nur zweidimensionale Abbildung (noch) 4
5 GRAFIKPIPELINE (3) Vereinfachter Aufbau der sog. Fixed-Function Pipeline 5
6 GRAFIKPIPELINE (4) Transformation: Matrixmultiplikation Vertexdaten werden mehrfach transformiert Model- nach Weltkoordinaten Welt- nach View-Koordinaten Projektive Transformation 6
7 GRAFIKPIPELINE (5) Dreiecke und andere Grafikprimitiven werden auf Fragmente (=Pixelkandidaten) abgebildet Diskretisierung der mathematischen Konstrukte Algorithmus von Bresenham Erweiterung um z.b. Beleuchtungsberechnung Werte nur an Eckpunkten bekannt Zwischenwerte werden interpoliert 7
8 PARALLELITÄT Grafikpipeline ist embarrassingly parallel Datenverarbeitung in allen Stufen parallelisierbar Vertices sind nicht voneinander abhängig Primitive können unabhängig gerastert werden Fragmentdaten sind unabhängig mehr Ausführungseinheiten = mehr Geschwindigkeit (3dfx SLI, ATI Crossfire, nvidia SLI) 8
9 0%&-1(23/7&%89&%$ : ;("2<&(%/=>?5/@5A?BC *DE/F$"$%&#$3 )(8$+ 3(F"&<G screen application geometry rasterization CPU!"#$%&'#()$ *+,-.#$%/0%&-1(23/4!"#%+ 56 VERLAGERUNG VON CPU AUF GPU Folien entnommen aus der Vorlesung Interaktive Computergrafik, Stamminger, LS9 9
10 0%&-1(23/7&%89&%$ : *+,,+8+%$ 6;< B%&-1(23 21(- B$"$%&#$3 )(8$+ 3(B"&C screen application geometry rasterization CPU GPU!"#$%&'#()$ *+,-.#$%/0%&-1(23/4!"#%+ 56 VERLAGERUNG VON CPU AUF GPU Folien entnommen aus der Vorlesung Interaktive Computergrafik, Stamminger, LS9 10
11 0%&-1(23/7&%89&%$ : ;#&%(/<=> 0?@/3.--+%#3 3(,-A$/BC/D%&-1(23 +-$%&#(+"3 screen application geometry rasterization CPU GPU!"#$%&'#()$ *+,-.#$%/0%&-1(23/4!"#%+ 56 VERLAGERUNG VON CPU AUF GPU Folien entnommen aus der Vorlesung Interaktive Computergrafik, Stamminger, LS9 11
12 0%&-1(23/7&%89&%$ : ;0!/!"8<= 0>?/8+$3 %&3#$%(@&#(+" +A/ #%(&"BC$3 screen application geometry rasterization CPU GPU!"#$%&'#()$ *+,-.#$%/0%&-1(23/4!"#%+ 56 VERLAGERUNG VON CPU AUF GPU Folien entnommen aus der Vorlesung Interaktive Computergrafik, Stamminger, LS9 12
13 0%&-1(23/7&%89&%$ : ;0!/< = > 0?@/&A3+/8+$3 #%&"3B+%,&#(+"3 screen application geometry rasterization CPU GPU!"#$%&'#()$ *+,-.#$%/0%&-1(23/4!"#%+ 56 VERLAGERUNG VON CPU AUF GPU Folien entnommen aus der Vorlesung Interaktive Computergrafik, Stamminger, LS9 13
14 0%&-1(23/7&%89&%$ : ;0!/<"=>?/"@(8(& 0$A+%2$5BBB 0CD/8+$3 $"#(%$ -(-$E("$ screen application geometry rasterization CPU GPU!"#$%&'#()$ *+,-.#$%/0%&-1(23/4!"#%+ 56 VERLAGERUNG VON CPU AUF GPU Folien entnommen aus der Vorlesung Interaktive Computergrafik, Stamminger, LS9 14
15 0%&-1(23/7&%89&%$ : ;(%3#/<$"$%&#(+"/-%+<%&,,&=>$/0?@3A "B(8(& 0$C+%2$CDE/FG!/H&8$+"E III 3("<>$ 3#&<$3 &%$ -%+<%&,,&=>$ $I<I/J/)$%#$K/-%+2$33+%3/&"8/6J/-(K$>/-%+2$33+%3 screen application geometry rasterization CPU GPU... DP4 o[hpos], c[0], v[opos] DP4 o[hpos], c[1], v[opos]...!"#$%&'#()$ *+,-.#$%/0%&-1(23/4!"#%+ 56 VERLAGERUNG VON CPU AUF GPU Folien entnommen aus der Vorlesung Interaktive Computergrafik, Stamminger, LS9 15
16 GPU UND SHADER GPU übernimmt mehr Aufgaben Wechsel von Fixed-Function-Pipeline zu programmierbaren Funktionseinheiten (Vertex-, Fragmentprogramme) Shader: Programm, das direkt auf GPU läuft und Vertex- bzw. Fragmentdaten ändern kann 16
17 SHADER MODELS Verschiedene Featuresets bzgl. Programmierbarkeit (sog. Shader-Model) 1.0: spezieller Assemblerdialekt 1.5: GLSL, Hochsprache aus OpenGL 2.0: cg, HLSL; (stark) begrenzte Instruktionszahl 3.0: dynamic flow control, hohe Instruktionsanzahl 4.0: geometry shader, unified shader model 17
18 PERFORMANCE-ENTWICKLUNG Überblick von 1994 bis 2004 (Release NV40) 18
19 GEFORCE 6 SERIES NV40: 222 Mio. Transistoren, 130nm Strukturbreite, 400 MHz (Athlon64 Newcastle: 68,5 Mio. Transistoren, 2.0 GHz) Shader-Model 3.0 Peak-Performance: hundreds of gigaflops (single precision) erscheint 2004 Ab Mitte 2005 Ablösung durch Geforce 7 (NV44) 19 Geforce 6800, Prozessor-Die
20 NV40 BANDBREITEN Northbridge to GPU: PCIe 16x; Northbridge to CPU/System DRAM: 800MHz FSB GPU to Graphics DRAM: 550MHz DDR x 256 bit x 2 transfers per clock cycle = 35 GB/s 20
21 N V 4 0 I M D E TA I L Blockdiagramm der Geforce6-Architektur 21
22 N V 4 0 V E RT E X P R O C E S S O R Alle (Vektor-)Komponenten werden mit 32-bit Fließkommzahlen berechnet 22
23 VERTEX PROCESSOR Genauigkeit: fp32, fp16 eine SIMD-MADD-Instruktion und eine Skalarfunktion pro Taktzyklus Skalarfunktionen: exponential: exp, lit, log reziprok: rcp, rsq trigonometrisch: sin, cos Zugriff auf bis zu vier Texturen; nur nearest neighbor Filtering 23
24 NV40 FRAGMENT PROCESSOR Bearbeitet Blöcke der Größe 2x2 24
25 FRAGMENT PROCESSOR 4 Komponenten SIMD- Instruktionen Genauigkeit: fp32, fp16 3:1 coissue, 2:2 coissue dual issue dynamic flow control multiple render targets (MRT) 25
26 DATENFORMATE NV40 Texturzugriff sowohl von Vertex- als auch Fragmentprogramm möglich Formate: 1D, 2D, 3D, Cubemap mit fp16x2, fp16x4, fp32x1, fp32x2, fp32x4 Interpolation: nearest neighbor (Vertex Processor) bilinear, trilinear, anisotropic in 2D und Cubemap- Texturen (Fragment Processor) zusätzlich quad-linear für 3D-Texturen 26
27 GRAPHICS PIPELINE VS. GPGPU 27
28 GEFORCE 7 SERIES Geforce7 (NV44) basiert auf Geforce6-Design (NV40) Unterschiede: Takt (650 MHz vs. 400 MHz) Speichertakt (1,6 GHz statt 1,1 GHz) Mehr Ausführungseinheiten (24 statt 16 Pixelshader-Units, 8 statt 6 Vertex Pipelines) Spätere Geforce7-Modelle haben neue Chip-Revision: G70 28
29 FAZIT (1) Grafikhardware kann für General Purpose-Zwecke verwendet werden Umsetzung von Algorithmen jedoch schwierig Beispiel: Navier-Stokes Flüssigkeitssimulation auf Intel Pentium 4 2 GHz, NV35, NV40 29
30 FAZIT (2) Performance-Boost durch Parallelisierung Früher: Spezialisierung, heute: Generalisierung der Funktionseinheiten Trend setzt sich mit neueren Architekturen (G80) weiter fort 30
31 FRAGEN, ANMERKUNGEN? 31
32 QUELLEN Marc Stamminger: Folien zur Vorlesung Interaktive Computergrafik, Erlangen, Matt Pharr, Randima Fernando: GPU Gems 2: Programming Techniques for High-Performance Graphics and General-Purpose Computation,
Grafikkarten-Architektur
> Grafikkarten-Architektur Parallele Strukturen in der GPU Name: Sebastian Albers E-Mail: s.albers@wwu.de 2 > Inhalt > CPU und GPU im Vergleich > Rendering-Pipeline > Shader > GPGPU > Nvidia Tesla-Architektur
MehrEine Einführung in die Architektur moderner Graphikprozessoren
Eine Einführung in die Architektur moderner Graphikprozessoren Seminarvortrag von Sven Schenk WS 2005/2006 Universität Mannheim, Lehrstuhl für Rechnerarchitektur Inhalt Historische Eckpunkte Einführung
MehrThema: Hardware-Shader
Seminar Grafikprogrammierung Thema: Hardware-Shader Christian Bauer 03.07.08 Überblick Entwicklung Die Shader im Detail Programmierung GPGPU Zusammenfassung & Ausblick 1/19 Entwicklung (1) Früher: Berechnung
MehrUntersuchung und Vorstellung moderner Grafikchiparchitekturen
Fakultät Informatik, Institut für Technische Informatik, Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur Untersuchung und Vorstellung moderner Grafikchiparchitekturen Hauptseminar Technische
MehrÜbersicht 1. Anzeigegeräte 2. Framebuffer 3. Grundlagen 3D Computergrafik 4. Polygongrafik, Z-Buffer 5. Texture-Mapping/Shading 6. GPU 7. Programmierbare Shader 1 LCD/TFT Technik Rotation der Licht-Polarisationsebene
Mehr(7) Normal Mapping. Vorlesung Computergraphik II S. Müller. Dank an Stefan Rilling U N I V E R S I T Ä T KOBLENZ LANDAU
(7) Normal Mapping Vorlesung Computergraphik II S. Müller Dank an Stefan Rilling Einleitung Die Welt ist voller Details Viele Details treten in Form von Oberflächendetails auf S. Müller - 3 - Darstellung
MehrShader zur Bildbearbeitung
15. Oktober 2009 1 / 23 Übersicht 1 Motivation 2 Grundlagen 3 State of the Art 4 Konzeption 5 Implementierung 6 Benchmarks 7 Fazit 2 / 23 Motivation: GPU >> CPU Moores Law: Hardware verbessert sich rapide
MehrJörn Loviscach Hochschule Bremen
Programmierbare Hardware-Shader Jörn Loviscach Hochschule Bremen Überblick Vertex- und Pixel-Shader Anwendungsbeispiele fx-dateien Anwendungsbeispiele Zusammenfassung Puffer Vertex- und Pixel-Shader Hardware-Renderpipeline
MehrFachgebiet Programmiermethodik Prof. Dr. Claudia Leopold. Seminar Programmierung von Grafikkarten. GPGPU Basiskonzepte. von.
Fachgebiet Programmiermethodik Prof. Dr. Claudia Leopold Seminar Programmierung von Grafikkarten GPGPU Basiskonzepte von Marc Kirchhoff Inhaltsverzeichnis 1 Einleitung 2 2 Streams, Kernels und Prozessoren
MehrSpezialprozessoren zur Übernahme Grafik-spezifischer Aufgaben, vorrangig der Bildschirmausgabe
Grafikprozessoren Spezialprozessoren zur Übernahme Grafik-spezifischer Aufgaben, vorrangig der Bildschirmausgabe 2D: Berechnung der Bildes aus einfachen Grafikprimitiven 3D: Bildaufbau aus räumlicher Beschreibung
MehrMulticore-Architekturen
Universität Erlangen- Nürnberg Technische Universität München Universität Stuttgart Multicore-Architekturen Vortrag im Rahmen der Ferienakademie 2009 Kurs 1: Programmierkonzepte für Multi-Core Rechner
MehrGrundlagen der Spieleprogrammierung
Grundlagen der Spieleprogrammierung Teil I: 3D-Graphik Kapitel 9: Engines, Cg und anderes Peter Sturm Universität Trier Outline 1. Übersicht und Motivation 2. Mathematische Grundlagen 3. Das Ideal: Photorealistisch
MehrLehrstuhlseminar. NVidia Tegra-Architektur. Andreas Höer. TU Dresden, 23.05.2012. andreas.hoeer@mailbox.tu-dresden.de
Fakultät Informatik, Institut für Technische Informatik, Professur VLSI-Entwurfssysteme, Diagnostik und Architektur NVidia Tegra-Architektur Lehrstuhlseminar TU Dresden, 23.05.2012 andreas.hoeer@mailbox.tu-dresden.de
MehrKapitel 5: Graphikhardware und Parallelisierung
Kapitel 5: Graphikhardware und Parallelisierung 1 Überblick Taxonomie für Graphikhardware Historie der Graphikhardware Architektur-Beispiele Programmierbare Hardware Taxonomie von Parallelisierungsansätzen
MehrCell Broadband Engine
Cell Broadband Engine 21.March 2006 Benjamin Keck Outline Why Cell?!? Application Areas Architectural Overview SPU Programming Model Programming on the PPE C/C++ Intrinsics The Cell Supercomputer on a
MehrSeminar Game Development Game Computer Graphics. Einleitung
Einleitung Gliederung OpenGL Realismus Material Beleuchtung Schatten Echtzeit Daten verringern Grafik Hardware Beispiel CryEngine 2 Kristian Keßler OpenGL Was ist OpenGL? Grafik API plattform- und programmiersprachenunabhängig
MehrGPGPU-Architekturen CUDA Programmiermodell Beispielprogramm Organiosatorisches. Tutorial CUDA. Ralf Seidler
Friedrich-Alexander-Universität Erlangen-Nürnberg 05.10.2010 Outline 1 GPGPU-Architekturen 2 CUDA Programmiermodell 3 Beispielprogramm 4 Organiosatorisches Outlook 1 GPGPU-Architekturen 2 CUDA Programmiermodell
MehrSeminar: Grafikprogrammierung
Game Developer Converence 08 Seminar: Grafikprogrammierung Alexander Weggerle 17.04.08 Seite 2 Einführung Themenüberblick Organisatorisches Seminarablauf liches Seite 3 Einführung Seminar Motivation Vorbereitung
MehrOutline. Cell Broadband Engine. Application Areas. The Cell
Outline 21.March 2006 Benjamin Keck Why Cell?!? Application Areas Architectural Overview Programming Model Programming on the PPE C/C++ Intrinsics 1 2 The Cell Supercomputer on a chip Multi-Core Microprocessor
Mehrtechnische universität dortmund Lehrstuhl für Hochfrequenztechnik Übertragungssysteme
Lehrstuhl für Hochfrequenztechnik GPU-beschleunigte numerische Simulation faseroptischer Übertragungssysteme, Marius Helf, Peter Krummrich Übersicht Motivation Split-Step p Fourier Methode Ansätze für
MehrSeminar: Programmierung von Grafikkarten (SS 2006)
Seminar: Programmierung von Grafikkarten (SS 2006) Shader Christian Niemand (nemojr@gmx.de) Johannes Spohr (jspohr@student.uni-kassel.de) Universität Kassel, FB 16 Research Group Programming Languages
MehrOpenGL. (Open Graphic Library)
OpenGL (Open Graphic Library) Agenda Was ist OpenGL eigentlich? Geschichte Vor- und Nachteile Arbeitsweise glscene OpenGL per Hand Debugging Trend Was ist OpenGL eigentlich? OpenGL ist eine Spezifikation
MehrÜbersicht. Vergleich der Spielekonsole mit dem PC. Historie der Spielekonsolen von 1976 bis 1999
Übersicht Vergleich der Spielekonsole mit dem PC Historie der Spielekonsolen von 1976 bis 1999 Heutige Generation der Konsolen Überblick Vergleich der PS2 mit der XBox Ausblick auf die kommende Konsolengeneration
MehrCurrent and Emerging Architectures Multi-core Architectures and Programming
Current and Emerging Architectures Multi-core Architectures and Programming Adel El-Rayyes Hardware-Software-Co-Design, Friedrich-Alexander-Universität Erlangen-Nürnberg 9. Mai 2012 Inhalt Überblick über
Mehrmoderne Prozessoren Jan Krüger jkrueger@techfak.uni-bielefeld.de
moderne Prozessoren Jan Krüger jkrueger@techfak.uni-bielefeld.de Übersicht FachChinesisch SPARC - UltraSparc III/IV PowerPC - PowerPC 970(G5) X86 - Pentium4(Xeon), Itanium, (Pentium M) X86 - AthlonXP/MP,
MehrTexture Based Direct Volume Rendering
Texture Based Direct Volume Rendering Vorlesung: "Advanced Topics in Computer Graphics" cbrak@upb.de 1 Agenda 1. Einleitung Volume Rendering 1.1. Volumendatensatz 1.2. Volumenintegral 1.3. Image order
MehrGPGPU mit NVIDIA CUDA
01.07.12 GPGPU mit NVIDIA CUDA General-Purpose on Formatvorlagecomputing des Graphics Processing durch Units Untertitelmasters mit KlickenCompute bearbeiten NVIDIA Unified Device Architecture Gliederung
MehrMULTICORE- UND GPGPU- ARCHITEKTUREN
MULTICORE- UND GPGPU- ARCHITEKTUREN Korbinian Pauli - 17. November 2011 Seminar Multicore Programmierung, WS11, Universität Passau 2 Einleitung Klassisches Problem der Informatik: riesige Datenmenge! Volkszählung
MehrSeminar GPU-Programmierung/Parallelverarbeitung
Seite iv Literaturverzeichnis 1) Bengel, G.; et al.: Masterkurs Parallele und Verteilte Systeme. Vieweg + Teubner, Wiesbaden, 2008. 2) Breshears, C.: The Art of Concurrency - A Thread Monkey's Guide to
MehrDer Aufbau der Fusion-APU von AMD
Fakultät Informatik Institut für Technische Informatik, Lehrstuhl für VLSI-Entwurf, Diagnostik und Architektur Der von AMD Johannes Müller Dresden, 05.07.2011 Inhalt Geschichtliche Entwicklung Was ist
MehrHardware Tessellation in DirectX11 zur Berechnung von Levels of Detail in Echtzeitanwendungen
MASTER THESIS zur Erlangung des akademischen Grades Master of Science in Engineering im Studiengang 585 Hardware Tessellation in DirectX11 zur Berechnung von Levels of Detail in Echtzeitanwendungen Ausgeführt
MehrWorld of Warcraft. Mindestvoraussetzungen
World of Warcraft Betriebssystem Windows XP / Windows Vista / Windows 7 Windows 7 / Windows 8 64-bit mit Windows 8 mit aktuellstem Servicepack aktuellstem Servicepack Prozessor Intel Core 2 Duo E6600 oder
Mehr(13) Hot Topics. Vorlesung Computergrafik T. Grosch
(13) Hot Topics Vorlesung Computergrafik T. Grosch Heute Vorstellung der besten Flugsimulatoren Hot Topics T. Grosch - - Warum Hot Topics? Typischerweise i Computergrafik 1 : Grundlagen, konstant Computergrafik
MehrCUDA. Axel Jena, Jürgen Pröll. Multi-Core Architectures and Programming. Friedrich-Alexander-Universität Erlangen-Nürnberg Axel Jena, Jürgen Pröll 1
CUDA Axel Jena, Jürgen Pröll Multi-Core Architectures and Programming Axel Jena, Jürgen Pröll 1 Warum Tesla? Traditionelle Graphikkarten Getrennte Prozessoren für Vertex- / Pixelberechnungen - Nachteil:
MehrVergleich von Forward und Deferred Rendering
Vergleich von Forward und Deferred Rendering Kamil René König Bachelorarbeit Bachelor Informatik 12.08.2014 Betreuer: Prof. Dr. Detlef Krömker, Dr. Daniel Schiffner Übersicht Motivation Definitionen Forward
MehrFriedrich Hoermann 12.06.08 Hauptseminar Grafikprogrammierung. Grundlagen und Aufbau einer Grafikkarte
Friedrich Hoermann 12.06.08 Hauptseminar Grafikprogrammierung Grundlagen und Aufbau einer Grafikkarte Seite 2 Inhalt - Einleitung - Geschichte - Aufbau der Grafikkarte - Die Grafikpipeline - Ausblick Seite
MehrVHDL - Grundlagen des Pointrenderings
VHDL - Grundlagen des Pointrenderings Marc Reichenbach, Timo Nieszner Informatik 3 / Rechnerarchitektur Universität Erlangen Nürnberg 2013 1 / 25 Rendern von Dreiecksnetzen Quelle: Inf9, CG-Slides grobmaschiges
MehrBenchmarking Intel Pentium III-S vs. Intel Pentium 4
Benchmarking Intel Pentium III-S vs. Intel Pentium 4 André Ceselski Raphael Rosendahl 30.01.2007 Gliederung Motivation Vorstellung der Architekturen Intel P6 Architektur Intel NetBurst TM Architektur Architektur-Unterschiede
MehrRechner Architektur. Martin Gülck
Rechner Architektur Martin Gülck Grundlage Jeder Rechner wird aus einzelnen Komponenten zusammengesetzt Sie werden auf dem Mainboard zusammengefügt (dt.: Hauptplatine) Mainboard wird auch als Motherboard
MehrSoftwareprojekt Spieleentwicklung
Softwareprojekt Spieleentwicklung Prototyp I (2D) Prototyp II (3D) Softwareprojekt 12.04. 19.04. 26.04. 03.05. 31.05. Meilenstein I 28.06. Meilenstein II Prof. Holger Theisel, Tobias Günther, OvGU Magdeburg
MehrEin kleiner Einblick in die Welt der Supercomputer. Christian Krohn 07.12.2010 1
Ein kleiner Einblick in die Welt der Supercomputer Christian Krohn 07.12.2010 1 Vorschub: FLOPS Entwicklung der Supercomputer Funktionsweisen von Supercomputern Zukunftsvisionen 2 Ein Top10 Supercomputer
MehrPraktikum Computergrafik
Praktikum Computergrafik Steven Schlegel Abteilung für Bild- und Signalverarbeitung Betreuer: Steven Schlegel (schlegel@informatik.uni-leipzig.de) Einführung in OpenGL und GLSL OpenGL OpenGL (Open Graphics
MehrZwischenvortrag zum Entwicklungsstand der Bachelor-Arbeit. Direct 3D-Output für ein Rendering Framework
Zwischenvortrag zum Entwicklungsstand der Bachelor-Arbeit Direct 3D-Output für ein Rendering Framework von Benjamin Betting unter der Betreuung von Daniel Schiffner 1 Gliederung Kapitel I und II: Motivation,Einführung,Grundlagen
MehrProbelektion zum Thema. Shadow Rendering. Shadow Maps Shadow Filtering
Probelektion zum Thema Shadow Rendering Shadow Maps Shadow Filtering Renderman, 2006 CityEngine 2011 Viewport Real reconstruction in Windisch, 2013 Schatten bringen viel Realismus in eine Szene Schatten
MehrCUDA. Jürgen Pröll. Multi-Core Architectures and Programming. Friedrich-Alexander-Universität Erlangen-Nürnberg Jürgen Pröll 1
CUDA Jürgen Pröll Multi-Core Architectures and Programming Jürgen Pröll 1 Image-Resize: sequentiell resize() mit bilinearer Interpolation leicht zu parallelisieren, da einzelne Punkte voneinander unabhängig
MehrInstruktionen pro Takt
(c) Peter Sturm, Universität Trier (u.a.) 1 Instruktionen pro Takt 500 MIPS (Dhrystone) Taktfrequenz 450 400 350 300 250 200 150 100 50 0 8086 80286 80386 80486 Pentium Pentium Pro Die-Größen: Intel Vorlesung
MehrSeminar - Paralleles Rechnen auf Grafikkarten
Seminar - Paralleles Rechnen auf Grafikkarten Seminarvortrag: Übersicht über die Programmierung von Grafikkarten Marcus Schaber 05.05.2009 Betreuer: J. Kunkel, O. Mordvinova 05.05.2009 Marcus Schaber 1/33
MehrImplementierung und Evaluierung von Video Feature Tracking auf moderner Grafik Hardware
Implementierung und Evaluierung von Video Feature Tracking auf moderner Diplomarbeit vorgelegt von Sebastian Heymann Betreut von Prof. Dr. Bernd Fröhlich Bauhaus Universität t Dr. Aljoscha Smolic Fraunhofer
MehrInteraktives Motion-Capturing zur Echtzeitanimation virtueller Agenten
Interaktives Motion-Capturing zur Echtzeitanimation virtueller Agenten Bernhard-Andreas Brüning 1 Marc Erich Latoschik 2 Ipke Wachsmuth 3 AG Wissensbasierte Systeme 1,3 Technische Fakultät Universität
MehrGrafik- Programmierung
Grafik- Programmierung Seminar SS08 Thema: Stand der Technik/ Ausblick Moritz Dekorsy 10.07.2008 1 Inhaltsverzeichnis 1. Einführung...3 1.1 Stand der Technik...3 1.2 Unified Shader...3 1.3 Vorteile...6
MehrSpezialarchitekturen I (GPGPU: Architektur, Programmierung und Anwendungen)
SEMINAR: HIGH-PERFORMANCE RECONFIGURABLE COMPUTING 1 Spezialarchitekturen I (GPGPU: Architektur, Programmierung und Anwendungen) Mario Kicherer Zusammenfassung Die vorliegende Ausarbeitung beschäftigt
Mehr4. Mensch-Maschine Schnittstellen
4. Mensch-Maschine Schnittstellen 4.1 Geräte zur Visualisierung Farbmodelle e TFT-Displays 4.2 Grafikkarten Standards für Grafikkarten Aufbau von Grafikkarten VGA 4.3 Grafik-Beschleuniger Grafik-Beschleunigung
MehrOpenCL Implementierung von OpenCV Funktionen
Multi-Core Architectures and Programming OpenCL Implementierung von OpenCV Funktionen julian.mueller@e-technik.stud.uni-erlangen.de Hardware/Software Co-Design August 18, 2011 1 Table of content 1 OpenCL
MehrDie Architektur des Sun UltraSPARC T2 Prozessors, Anwendungsszenarien
Institut für Technische Informatik, Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur, Prof. Spallek Die Architektur des Sun UltraSPARC T2 Prozessors, Anwendungsszenarien Tobias Berndt, to.berndt@t-online.de
MehrIT für Führungskräfte. Zentraleinheiten. 11.04.2002 Gruppe 2 - CPU 1
IT für Führungskräfte Zentraleinheiten 11.04.2002 Gruppe 2 - CPU 1 CPU DAS TEAM CPU heißt Central Processing Unit! Björn Heppner (Folien 1-4, 15-20, Rollenspielpräsentation 1-4) Harald Grabner (Folien
MehrEin Windows Vista-PC. Peter G. Poloczek M5543 PGP II/07
Ein Windows Vista-PC Peter G. Poloczek M5543 Asrock - AM2NF6G-VSTA AM2NF6G-VSTA Socket AM2 for AMD Athlon 64FX / 64X2 / 64, Sempron CPUs NVIDIA GeForce 6100 / nforce 405 Chipset FSB 1000MHz (2.0GT/s),
MehrGPU-Computing. Michael Vetter
GPU-Computing Universität Hamburg Scientific Visualization and Parallel Processing @ Informatik Climate Visualization Laboratory @ Clisap/CEN Übersicht Hintergrund und Entwicklung von GPGPU Programmierumgebungen
MehrGPU Programmierung. Thorsten Grosch
Thorsten Grosch Willkommen zur ersten Vorlesung! g Heute Organisatorisches Vorstellung von Team und Vorlesung Historischer Rückblick zu GPUs 2 Das Team Vorlesung Jun.-Prof. Thorsten Grosch AG Computervisualistik
Mehr4. Kapitel 3D Engine Geometry
15.11.2007 Mathematics for 3D Game Programming & Computer Graphics 4. Kapitel 3D Engine Geometry Anne Adams & Katharina Schmitt Universität Trier Fachbereich IV Proseminar Numerik Wintersemester 2007/08
MehrK&R Monza Office, Internet und Multimedia-PC!
K&R Monza Office, Internet und Multimedia-PC! Ab sofort mit Intel Core i3 3,40 Ghz Neu: Mainboard Gigabyte GA-H97M-D3H NEU: 1 TB Seagate Barracuda Festplatte aufrüstbar durch modulare Bauweise (alle gängingen
MehrShadingalgorithmen zur Visualisierung nanostrukturierter Oberflächen
Universität Hamburg Fachbereich Informatik Arbeitsbereich Technische Aspekte Multimodaler Systeme Seminar Informatikanwendungen in Nanotechnologien Betreuer: Bernd Schütz Sommersemester 2014 Shadingalgorithmen
MehrStream Processing und High-Level GPGPU Sprachen
Seminar: Programmierung von Grafikkarten Stream Processing und High-Level GPGPU Sprachen Jens Breitbart brietbar@student.uni-kassel.de Abstract Die Leistung aktueller Prozessoren erhöht sich sehr viel
MehrAnkermann PC Dokumentation
Ankermann PC Dokumentation 1 CPU (Prozessor): Intel Core i7-2600k Quad-Core Sandy Bridge 4x 3.40 GHz Turbo boost 3,80 GHz Multiplikator frei wählbar. Gefahrlos übertaktbar bis 4,50 GHz. L2-Cache: 4 x 256
MehrGPU Programmierung. Thorsten Grosch
Thorsten Grosch Willkommen zur ersten Vorlesung! g Heute Organisatorisches Vorstellung von Team und Vorlesung Historischer Rückblick zu GPUs 2 Das Team Vorlesung Jun.-Prof. Thorsten Grosch AG Computervisualistik
MehrHeute. Motivation. Verfügbarkeit. Programmierbare Hardware-Shader. Technische Entwicklung von Grafikhardware. Grafikpipeline (DirectX9)
t.jung@fhtw-berlin.de Heute Programmierbare Hardware-Shader Thomas Jung Architektur moderner Grafikkarten Rendering von Polygonlisten mit DirectX9 Vertex- und Pixel(Fragment) shader Motivation Spiele kommen
MehrComputergrafik. Peter Rösch Hochschule Augsburg University of Applied Sciences. Sommersemester 2014. Version: 24. März 2014
Peter Rösch Hochschule Augsburg University of Applied Sciences Sommersemester 2014 Version: 24. März 2014 Sommer 2014, HS Augsburg, Peter Rösch Inhalt [1] 1. Einführung 2. WebGL und GLSL 3. Geometrie und
MehrUniversität Osnabrück Fachbereich Mathematik / Informatik. 5. Vorlesung ( )
Universität Osnabrück Fachbereich Mathematik / Informatik 5. Vorlesung (06.05.2013) Prof. Dr. rer. nat. Oliver Vornberger Nico Marniok, B. Sc. Erik Wittkorn, B. Sc. Game Application Layer Rückblick Game
MehrWas sind Computerspiele? (c) 2013, Peter Sturm, Universität Trier
Was sind Computerspiele? 1 Das Ideal: Photorealistisch Anwendung der relevanten physikalischen Gesetze Lichtreflektion und brechung Samt u.a. Objekteigenschaften (Oberflächenbeschaffenheit) Viele Freiheitsgrade
Mehr-,N. ep S ät KW 32/33
verproduktion otebook-undser -,N C ep hr Ja 25 mehrals andort amproduktionsst er nt ce ce vi er S ldungsquote zeund20%ausbi ät pl ts ei rb ea rt hunde KW 32/33 TERRA PreisUpdate KW 32/33 - Systeme EOL
MehrMulticore Herausforderungen an das Software-Engineering. Prof. Dr.-Ing. Michael Uelschen Hochschule Osnabrück 15.09.2010
Multicore Herausforderungen an das Software-Engineering Prof. Dr.-Ing. Michael Uelschen Hochschule Osnabrück 15.09.2010 Inhalt _ Motivation _ Herausforderung 1: Hardware _ Herausforderung 2: Software-Partitionierung
MehrLeistungsverteilung im Rechner
Leistungsverteilung im Rechner Christian Möde Seminar Green IT 1 Ausgangssituation Green IT ist schwer in Mode Angeheizt durch steigende Energiepreise, sowie die Klimaschutzdiskussion Mitte 2008: erstmals
MehrEntwicklung eines Partikelsystems auf Basis moderner 3D-Grafikhardware
Entwicklung eines Partikelsystems auf Basis moderner 3D-Grafikhardware Studienarbeit Vorgelegt von Philipp Pätzold Institut für Computervisualistik Arbeitsgruppe Computergraphik Betreuer: Prüfer: Dipl.-Inform.
MehrHigh-Performance Bildverarbeitung (nicht nur) mit JAVA. Prof. Dr.Thomas Netzsch - Hochschule Darmstadt - University of Applied Sciences
High-Performance Bildverarbeitung (nicht nur) mit JAVA 1 High-Performance Bildverarbeitung (nicht nur) mit JAVA Fragen: wie kann ein typisches BV-Unternehmen wirtschaftlich an der aktuellen Hardwareentwicklung
Mehr19.09.2014. 2D-Texturen. Reflectance Mapping 3D-Texturen. Farbtexturen
2D-Texturen Texturarten Transformationen Generierung Thomas Jung Reflectance Mapping 3D-Texturen Modellierung von Details erfordert Zeit Darstellung ist aufwendig (langsam) Details belegen Speicherplatz
MehrOpenCL. OpenCL. Boris Totev, Cornelius Knap
OpenCL OpenCL 1 OpenCL Gliederung Entstehungsgeschichte von OpenCL Was, warum und überhaupt wieso OpenCL CUDA, OpenGL und OpenCL GPUs OpenCL Objekte Work-Units OpenCL Adressbereiche OpenCL API Codebeispiel
MehrEinführung in die Computergrafik
Einführung in die Computergrafik Proseminar Computergrafik Zuse Institut Berlin 22. November 2007 Organisatorisches Informationen rund um s Seminar. http://www.zib.de/hotz/teaching/currentlectures.htm
MehrGrafikkarten. Institut für Informatik, LMU München Seminar: Medientechnik, SoSe 2003 LS Prof. Hussman Referentin: Milena Velikova
Grafikkarten Institut für Informatik, LMU München Seminar: Medientechnik, SoSe 2003 LS Prof. Hussman Referentin: Einführung Die Grafikkarte die Schnittstelle zur visuellen Ausgabe von Daten wandelt Signale
MehrEinleitung. Komplexe Anfragen. Suche ist teuer. VA-File Verfeinerungen. A0-Algo. GeVAS. Schluß. Folie 2. Einleitung. Suche ist teuer.
Anwendung Input: Query-Bild, Ergebnis: Menge ähnlicher Bilder. Kapitel 8: Ähnlichkeitsanfragen und ihre effiziente Evaluierung Wie zu finden? Corbis, NASA: EOS Bilddatenbank Folie Folie 2 Ähnlichkeitssuche
Mehrcomputer graphics & visualization
Entwicklung und Implementierung echtzeitfähiger Verfahren zur Darstellung von reflektierenden Objekten auf GPUs echtzeitfähiger Verfahren zur Darstellung von reflektierenden Objekten auf GPUs Motivation
MehrAcer Notebooks. Preisliste gültig ab 07.12.2010. Inhaltsverzeichnis:
Inhaltsverzeichnis: Home NBs Übersicht 2 Business NBs Übersicht 5 Acer TM8572-TimelineX Serie 10 Acer TM8472-TimelineX Serie 12 Acer TM8372-TimelineX Serie 14 Acer TM8172-TimelineX Serie 16 Acer TravelMate
MehrFakultätsname XYZ Fachrichtung XYZ Institutsname XYZ, Professur XYZ. Big.LITTLE-Processing mit ARM- Cortex-Prozessoren. E. Zenker
Fakultätsname XYZ Fachrichtung XYZ Institutsname XYZ, Professur XYZ Big.LITTLE-Processing mit ARM- Cortex-Prozessoren E. Zenker Dresden, 14.12.2011 TU Dresden, 14.12.11 Folie 2 von 21 Performance Video
MehrPraktikum im Bereich Praktische Informatik Echtzeitgraphik in C++ und DirectX10. computer graphics & visualization
Praktikum im Bereich Praktische Informatik Echtzeitgraphik in C++ und DirectX10 Billboards Letztes Übungsblatt: Meshes & Instancing um dem Terrain zusätzliche Details (Vegtation) hinzuzufügen. Nachteil:
MehrSamsungs Exynos 5 Dual
Fakultät Informatik, Institut für Technische Informatik, Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur Samsungs Exynos 5 Dual Candy Lohse Dresden, 12.12.12 Gliederung 1. Motivation und
MehrSoftware Engineering für moderne, parallele Plattformen. 9. GPGPUs: Grafikkarten als Parallelrechner. Dr. Victor Pankratius
Software Engineering für moderne, parallele Plattformen 9. GPGPUs: Grafikkarten als Parallelrechner Dr. Victor Pankratius Dr. Victor Pankratius, Dipl.Inform. Frank Otto IPD Tichy Lehrstuhl für Programmiersysteme
MehrHochleistungsberechnungen für Industrie und Weltraum
Christian Federspiel Hochleistungsberechnungen für Industrie und Weltraum christian.federspiel@catalysts.at Stagnation seit 2005 Performance Parameter Entwicklung von 2005-2020 Taktfrequenz L1 / L2 Cache
MehrHochleistungsrechnen auf Grafikkarten für innovative Automotiveanwendungen Simulation der Wasserdurchfahrt eines Serienfahrzeugs
auf Hochleistungsrechnen auf für innovative Automotiveanwendungen Simulation der Wasserdurchfahrt eines Serienfahrzeugs Thorsten Grahs, Christian Janßen move-csc UG, Inst. Scientific Computing, TU Braunschweig
MehrTecNews: Sandy Bridge
TecNews: Sandy Bridge Werner Fischer, Technology Specialist Thomas-Krenn.AG Thomas Krenn Herbstworkshop & Roadshow 2011 23.09. in Freyung 06.10. in Wien (A) 10.10. in Frankfurt 11.10. in Düsseldorf 12.10.
MehrAktuelle Grafikleistungen
Aktuelle Grafikleistungen Alexander Hötzendorfer 3. Juli 2007 1 Inhaltsverzeichnis 1 Einleitung 3 2 Aktuelle Techniken 3 2.1 HDR-Lighting.............................. 3 2.2 Tessellation...............................
MehrHW/SW Codesign 5 - Performance
HW/SW Codesign 5 - Performance Martin Lechner e1026059 Computer Technology /29 Inhalt Was bedeutet Performance? Methoden zur Steigerung der Performance Einfluss der Kommunikation Hardware vs. Software
MehrOpenCL. Seminar Programmiersprachen im Multicore-Zeitalter Universität Siegen Tim Wiersdörfer tim.wiersdoerfer@student.uni-siegen.
OpenCL Seminar Programmiersprachen im Multicore-Zeitalter Universität Siegen Tim Wiersdörfer tim.wiersdoerfer@student.uni-siegen.de Abstract: In diesem Dokument wird ein grundlegender Einblick in das relativ
MehrGrakkarten - Programmierung
Grakkarten - Programmierung Version 1.3 20.02.2006 Marc Blunck 97129 Diese Ausarbeitung befasst sich mit der Programmierung von Grakprozessoren. meint General Purpose Computation On Graphics
Mehr20 Jahre. acadgraph CADstudio GmbH Fritz-Hommel-Weg 4 80805 München Seite 1 von 11
Seite 1 von 11 Inhaltsverzeichnis 1 - Features & Benefits... 3 1.1 Schnell und einfach Eye Checker erstellen... 3 1.2 Einfach zu erlernen... 3 1.3 Voll CAD-Kompatibel... 3 2 - Arbeitsweise... 3 2.1 Userinterface...
MehrErfolg mit Embedded Vision Systemen. Dipl.-Ing. Carsten Strampe Embedded Vision Systeme 1
Erfolg mit Embedded Vision Systemen Dipl.-Ing. Carsten Strampe Embedded Vision Systeme 1 Erfolg mit Embedded Vision Systemen Embedded Prozessoren vs. X86er Derivate DSP vs. FPGA vs. GPP wer ist geeigneter
MehrPhilipp-Melanchthon-Gymnasium Bautzen Lk Mathematik Kl. 11. Schwerpunkt: Aufgaben ohne HM Abitur Sachsen
Übungen zur Analytischen Abitur 00 Die Punkte A( 0), B( 0) und C(5 0) sind Eckpunkte eines Rechtecks ABCD. Der Punkt S ist die Spitze einer geraden Pyramide mit dem Rechteck ABCD als Grundfläche und der
MehrEchtzeitfähige Rekonstruktion für die Flachdetektor- Computertomographie auf Grafikhardware
Aus dem Institut für Medizinische Physik der Friedrich-Alexander-Universität Erlangen-Nürnberg Direktor: Prof. Dr. Dr. med. h. c. Willi A. Kalender, Ph. D. Echtzeitfähige Rekonstruktion für die Flachdetektor-
MehrComputer in Meiderich Computer in Meiderich. Einstecken und fertig! Windows bereits installiert. Monitor, Tastatur und Mouse einstecken und loslegen!
Computer in Meiderich Computer in Meiderich Bald ist es wieder so weit! terra 2250W Öffnungszeiten : Montag - Freitag : Samstag: Samstag nur Verkauf, kein Service! Einstecken und fertig! Windows bereits
MehrBACHELORARBEIT. Herr Mario Gienapp. GPGPU Computing - Parallele Programmierung mit CUDA und OpenCL
BACHELORARBEIT Herr Mario Gienapp GPGPU Computing - Parallele Programmierung mit CUDA und OpenCL 2012 Fakultät Elektro- und Informationstechnik BACHELORARBEIT GPGPU Computing - Parallele Programmierung
MehrTutorium Rechnerorganisation
Woche 7 Tutorien 3 und 4 zur Vorlesung Rechnerorganisation 1 Christian A. Mandery: KIT Universität des Landes Baden-Württemberg und nationales Grossforschungszentrum in der Helmholtz-Gemeinschaft www.kit.edu
MehrOpteron und I/O. Toni Schmidbauer. 11. Mai Zusammenfassung. Eine kurze Beschreibung der AMD Opteron Architektur.
Opteron und I/O Toni Schmidbauer 11. Mai 2005 Zusammenfassung Eine kurze Beschreibung der AMD Opteron Architektur Inhaltsverzeichnis 1 Allgemeines 2 2 Was ist ein Interconnect? 2 3 Traditionelles PC Chipset
MehrEchtzeit-Raytracing algebraischer Flächen auf der Graphics Processing Unit
Diplomarbeit Echtzeit-Raytracing algebraischer Flächen auf der Graphics Processing Unit Christian Stussak 12. Juli 2007 betreut durch Dr. rer. nat. habil. Peter Schenzel Martin-Luther-Universität Halle-Wittenberg
Mehr