Vertiefungsrichtung Rechnerarchitektur

Ähnliche Dokumente
Vertiefungsrichtung Rechnerarchitektur

Parallele Rechnerarchitekturen

Games with Cellular Automata auf Parallelen Rechnerarchitekturen

Lehrstuhl für Informatik 12 (Hardware-Software-Co-Design) Prof. Dr.-Ing. J. Teich

Prof. Dr.-Ing. Peter Schulz

Vorstellung der Fachgebiete

Prozessor- und Rechnerarchitekturen (Master)

Lehrstuhl für Informatik 12 (Hardware-Software-Co-Design) Friedrich-Alexander-Universität Erlangen-Nürnberg Prof. Dr.-Ing. J.

SPKC. Inhalte der Vorlesung. Signalprozessoren und Kommunikationscontroller. Prof. Dr.-Ing. Peter Schulz. Signalprozessoren

Stellenausschreibungen

Technische Grundlagen der Informatik 2 SS Einleitung. R. Hoffmann FG Rechnerarchitektur Technische Universität Darmstadt E-1

FPGA - aktuelle Bausteine und ihre Anwendungen von Altera

Architekturen, Werkzeuge und Laufzeitumgebungen für eingebettete Systeme

Echtzeitbildverarbeitung mit FPGAs. Feith Sensor to Image GmbH, Schongau Matthias Schaffland

Rechneraufbau und Rechnerstrukturen

ASIC-SYNTHESE DER SHAP-MIKROARCHITEKTUR

Rechneraufbau und Rechnerstrukturen

Ressourceneffiziente Informationsverarbeitung Universität Bielefeld, CITEC, AG-KS Martin Kaiser.

2. Der ParaNut-Prozessor "Parallel and more than just another CPU core"

Orientierungsveranstaltungen 2009 Informatikstudien der Universität Wien

Partitionierung von rechenintensiven Aufgaben zwischen FPGA und CPUs

SOC - System on a Chip

Digital Design 5 Rechnergestützte Schaltungsentwicklung

Configurable Embedded Systems

FPGA. Field Programmable Gate Array

FPGA-basierte Automatisierungssysteme

Technischen Informatik 1. Jörg Kaiser IVS EOS

Prof. Dr. Uwe Brinkschulte. Lehrstuhl für Eingebettete Systeme

Modulliste. für den Bachelorstudiengang. Informatik. an der Otto-von-Guericke-Universität Magdeburg Fakultät für Informatik

Datenflussrechnen mit FPGAs für die biomedizinische Bildverarbeitung

Verteidigung der Bachelorarbeit, Willi Mentzel

Prozessorarchitektur SS2017 Rahmenbedingungen zum Praktikum

Hardware Praktikum 2008

RST-Labor WS06/07 GPGPU. General Purpose Computation On Graphics Processing Units. (Grafikkarten-Programmierung) Von: Marc Blunck

Multiprozessor System on Chip

Hochleistungsrechnen in Darmstadt: Der Lichtenberg- Hochleistungsrechner. Dr. Andreas Wolf. Gruppenleiter Hochleistungsrechnen Hochschulrechenzentrum

Entwurf eines FPGA-Cores zur Simulationsbeschleunigung zeitkontinuierlicher Modelle im HiL Kontext

Parallel Computing. Einsatzmöglichkeiten und Grenzen. Prof. Dr. Nikolaus Wulff

Institut für Verteilte Systeme SS08 HASE

Georg Hager Regionales Rechenzentrum Erlangen (RRZE)

Mehrprozessorarchitekturen

Zwischenbericht zum Projekt FPGA-Entwurfssystem

Auszug aus dem Protokoll über die nichtöffentlichen Sitzung des Prüfungsausschusses der Lehreinheiten Mathematik und Informatik

MikroController und Mikroprozessoren

Vorstellung des Fachgebietes Technische Informatik

Masterpraktikum Scientific Computing

CE-Bachelor Studiengang

Mikrocontroller und Mikroprozessoren

Studienplan FSPO 2014/2017 Master Informationssystemtechnik

Modulliste. für den Bachelorstudiengang. Wirtschaftsinformatik. an der Otto von Guericke Universität Magdeburg Fakultät für Informatik

Outline Schieberegister Multiplexer Zähler Addierer. Rechenschaltungen. Marc Reichenbach und Michael Schmidt

Modulliste. für den Bachelorstudiengang. Wirtschaftsinformatik. an der Otto-von-Guericke-Universität Magdeburg Fakultät für Informatik

Compute Unified Device Architecture CUDA

Masterpraktikum Scientific Computing

Vortrag zum Hauptseminar Hardware/Software Co-Design

Fachgebietsvorstellung g 2010

DuE-Tutorien 4 und 6. Tutorien zur Vorlesung Digitaltechnik und Entwurfsverfahren Christian A. Mandery. WOCHE 14 AM

Äquivalenzübersicht für den Bachelorstudiengang Technische Informatik

EHP Einführung Projekt A

Super rechnen ohne Superrechner Oder: Was hat das Grid mit Monte Carlo zu tun?

Sicherheit in eingebetteten Systemen Luxus oder Notwendigkeit?

CUDA. Moritz Wild, Jan-Hugo Lupp. Seminar Multi-Core Architectures and Programming. Friedrich-Alexander-Universität Erlangen-Nürnberg

FPGA Beschleuniger. Your Name. Armin Jeyrani Mamegani Your Organization (Line #2)

Digitales Hardwaredesign mit VHDL und FPGAs

Rechnerstrukturen Winter EINFÜHRUNG. (c) Peter Sturm, University of Trier 1

Intel P6 (Intel Pentium Pro) - Besonderheiten, Techniken und Architektur

Entwicklung von Partitionierungsstrategien im Entwurf dynamisch rekonfigurierbarer Systeme

STUDIENARBEIT: ZWISCHENPRÄSENTATION

OpenCL. OpenCL. Boris Totev, Cornelius Knap

Modulübersicht. Bachelorstudiengang Elektro- und Informationstechnik. Stand: Fakultät für Elektro- und Informationstechnik

N Bit Binärzahlen. Stelle: Binär-Digit:

Modulliste. für den Bachelorstudiengang. Wirtschaftsinformatik. an der Otto von Guericke Universität Magdeburg Fakultät für Informatik

Deep Learning Appliance 4U Die Ready-to-Brain Komplett-Lösung

(Software) Architektur der Dinge. Roland Graf / Simon Kranzer IKT-Forum 2016 I(o)T for Industry - Von IT zu IoT

Mikroelektronik-Ausbildung am Institut für Mikroelektronische Systeme der Leibniz Universität Hannover

Lehrkonzept für den Bereich Technische Informatik

2 Rechnerarchitekturen

Das HLRN-System. Peter Endebrock, RRZN Hannover

Tabelle der MASTER-Vorlesungen (CSM/CS3) für WS1718 Stand:

Multicore-Architekturen

Ein kleiner Einblick in die Welt der Supercomputer. Christian Krohn

Eine kurze Einführung in Rechnerarchitektur und Programmierung von Hochleistungsrechnern als zentrales Werkzeug in der Simulation

GPGPU-Architekturen CUDA Programmiermodell Beispielprogramm. Einführung CUDA. Ralf Seidler. Friedrich-Alexander-Universität Erlangen-Nürnberg

LEISTUNGSVERGLEICH VON FPGA, GPU UND CPU FÜR ALGORITHMEN ZUR BILDBEARBEITUNG PROSEMINAR INF-B-610

Data Warehousing 0-1. DBS-Module

Einführung. GPU-Versuch. Andreas Schäfer Friedrich-Alexander-Universität Erlangen-Nürnberg

Open Source - Mikrokontroller für Mixed Signal ASIC

HW/SW Codesign 5 - Performance

Technische Informatik I

Universität Karlsruhe (TH)

FACHBEREICH TECHNIK INTERNET OF THINGS DIGITALE AUTOMATION BACHELOR OF ENGINEERING

Inhaltsübersicht. Einführung

Institut für Angewandte Mikroelektronik und Datentechnik Fachbereich Elektrotechnik und Informationstechnik Universität Rostock.

Seminar: Multi-Core Architectures and Programming

> High-Level Programmierung heterogener paralleler Systeme

IuK-Projekt am Institut für Mikroelektronik und Eingebettete Systeme. Prof. Dr.-Ing. Peter Schulz Sommersemester 2013

Ein Debugger für ASIC-Prototypen

&R9HULILNDWLRQYRQ$50'HVLJQVPLW5LYLHUD,37

Fächer und Prüfungen

Motivation (GP)GPU CUDA Zusammenfassung. CUDA und Python. Christian Wilms. Integriertes Seminar Projekt Bildverarbeitung

Transkript:

srichtung () ( für ) Prof. Dietmar Fey 1

Ziele der srichtung RA Vertiefen des Verständnis vom Aufbau, Funktionsweise von Rechnern und Prozessoren () Modellierung und Entwurf von Rechnern und Prozessoren Leistungsbewertung Erlernen der Prinzipien des parallelen Rechnens in groß-skalierten Umgebungen Cluster-Rechner, heterogene Cluster (CPU / GPU-Cluster), Grids / Clouds In klein-skalierten Umgebungen Multikern-Prozessoren, Eingebetteten Systemen 2

Vorlesungsübersicht () 3

Wahlpflicht-Modul 2+2+2 SWS, 5 bzw. 7,5 ECTS, jeweils WS Basis für jeweiligen Themengebiete in RA () 4 Inhalte Fortgeschrittene Techniken in heutigen Prozessoren Cache-Architekturen Dynamische Sprungvorhersage Pipelineverarbeitung Modellierung von (Multicore)-Prozessoren Realisierung in heutigen Prozessoren (Intel, AMD, Nvidia GPU) Klassische Parallelrechner Eingebettete Prozessoren und Signalprozessoren Das Innere eines Prozessors im Detail vom v.neumann- Rechner bis zur Corei7-Architektur

Modul () Verstehen der Funktion eines modernen Prozessors CISC-/RISC-/Superskalare Prozessorarchitekturen Wie funktioniert dynamische Sprungvorhersage? Wie funktioniert ein Cache bzw. Hierarchie von Caches? Warum gibt es Multikern-Prozessoren? Wie ist eine GPGPU aufgebaut? Wie arbeiten Parallelrechner? Leistungsanalyse von Multikern-Prozessoren, Parallelrechner Erproben der Theorie in Rechnerübung Cache-Simulatoren Ausnutzen von Cache-Effekten in eigenen Programmen Simulatoren dynamische Sprungvorhersage Hardware-nahe Multicore-Programmierung OpenMP, CUDA, MPI 5

Modul Algorithmen für Sensorfusion Optischer Fluss Fußgänger-Detektion () 6

Module zum Bereich () Anwendungsspezifische Prozessoren für Eingebettete Systeme FPGA-, ASIC-Design, Intelligente Sensorik, Hardwarenahe Programmierung 7

Modul CPU-Entwurf mit VHDL CPU-Entwurf mit VHDL 2+2+2 SWS, 5 / 7.5 ECTS, jeweils im SS Inhalte Hardware-Entwurf in VHDL Hardware-Design-Flow (Synthese für FPGA) () 8

Modul CPU-Entwurf mit VHDL Simulation Synthesefähige VHDL-Beschreibungen Grundschaltungen in VHDL (für ASIC und FPGA) Einführung in Verifikations-Techniken Übungen Entwurf einer einfachen GPU-Rendereinheit / MIPS-Prozessor Arbeiten mit Standard-Entwurfswerkzeugen () 9

Modul CPU-Entwurf mit VHDL () CPU-Entwurf mit VHDL 2+2+2 SWS, 5 bzw. 7.5 ECTS, jeweils SS Inhalte Konkrete Umsetzung der Prozessor-Mechanismen aus RA Entwicklung einer Single-Core / Multi-Core - CPU mit Pipelines / Caches Übung Entwurf mit VHDL Simulation und Test Prototyp in FPGA 10

Einführung digitaler ASIC-Entwurf Einführung digitaler ASIC-Entwurf 2+2+2 SWS, 5 bzw. 7,5 ECTS, jeweils WS () Von der Architektur -Idee zum eigenen Chip Entwurf einer einfachen Multicore-CPU Digitalentwurf aus VHDL-Beschreibung Aufbau FPGA-Prototyp Einsatz von gängigen Designwerkzeugen CADENCE, Synopsys 11

Modul FPGA-Online () FPGA-Online 4+2 SWS, 5 ECTS, jeweils SS und WS E-Learning-Kurs der Virtuellen Hochschule Bayern (VHB) Zugriff auf Remote-Labor vom heimischen PC Inhalt Einführung in die FPGA-Technologie Einführung in den Hardware-Designflow Schaltungs-Spezifikation mit FSMs Kommunikation mit externen Komponenten Rechenschaltungen 12

Module zum Bereich () Groß-skaliertes paralleles Rechnen, Standardprozessoren Cluster, Multi-Cluster, Grids / Clouds und Multikern-Prozessoren, GPGPUs 13

Cluster- und Grid Computing () 14 Modul: Programmierung und Architekturen von Cluster-Rechnern (PACL) 4+2 SWS, 7,5 ECTS, jeweils SS Inhalte Cluster-/Grid-/Cloud- Computing-Architekturen Beispiele für Hochleistungsrechnen mit Clustern und Grids Netzwerke in Cluster-Rechnern Programmierung von Cluster- Rechnern unter MPI Middleware für Cluster-Rechner und Grid-Computing Leistungsmaße für paralleles Rechnen Übung Praktische Erprobung am Cluster-Rechner heterogener einfacher Multi-Cluster Verwendbar auch für Programmiersysteme

Parallerechnerarchitekturen () Modul: Architectures of Supercomputers 2+2 SWS, 5 ECTS, jeweils WS Inhalte Vermittlung fortgeschrittener Prinzipien in der Architektur von Prozessoren (µcore-cpus, GPGPU) fortgeschrittene Sprungvorhersage-Techniken Cache-Architekturen Superrechner-Architekturen Übung Hardwarenahe Programmierung von Multikern-Prozessoren Anwendungen rechenintensive Anwendungen aus CS und CE 15

Supercomputing-Praktikum Supercompting-Praktikum 8 SWS, 10 ECTS, jeweils SS Inhalte Hochleistungs-Cluster-Computer planen und zusammenbauen Applikationen installieren, ausmessen & optimieren Administration, Monitoring, Debugging Verstehen der Funktionsweise einer HPC-Architektur () Teilnahme an Student Cluster Competition auf der Supercomputing (SC) oder Int. SC (ISC) 16

Supercomputing-Praktikum Simply the best / ISC Frankfurt, Juni 2017 () 17

Smart Camera Praktikum Intelligente Kameras für autonomes Fahren Ziel des Praktikums Fahrbahnlinienerkennung und Spurhalteassistent für ein RC-Car auf einer heterogenen 18

Smart Camera Praktikum Lehrinhalte Algorithmen zur Fahrbahnlinienerkennung Einstieg in VHDL Grundlagen moderner Bildsensoren Entwicklung von Beschleunigerkernen für Algorithmen zur Bildvorverabeitung Integration des Kamerasystems auf einem RC-Car 19

SDI-Labor Intelligente Leistungselektronik BALL-TRACKING ALGORITHMUS Vernetzte Eingebettete Systeme STRA Opening Closing Autonomes RC-Car PERFORMANCE Autonomer Multicopter 2016 International Conference on Reconfigurable Computing and FPGAs - Steffen Vaas 20

Bachelor-Seminar: Prozessor- Architekturen Bachelor-Seminar: Architektur von Multikern- und Vielkern-Prozessoren 2 SWS, 5 ECTS, jeweils SS () Vorträge: Vorstellen von neuen Architekturen Praktische Erprobung: Berechnen von Anamorphosen auf verschiedenen Multikern-Architekturen 21

Unkonventionelles Rechnen () Seminar: Unkonventionelles Rechnen 2 SWS, 5 ECTS, jeweils WS Inhalte DNA-Computing Quantencomputing Spintronik Memristoren In-memory computing Reversible Logik Nanocomputing Dark Silicon Ternäres Rechnen http://qt.tn.tudelft.nl/research/ nanowires/set.php 22

Beispiel: Übertragsfreie Addition Addieren in zwei Schritten zur Basis r = 2 mit ternären Ziffern x i, y i {-1, 0, +1} Operands 2 4 2 3 2 2 2 1 2 0 x 0 1 1 1 = (+7) 10 + y 0 0 0 1 = (+1) 10 Step 1 0-1 -1 0 = z 0 1 1 1 0 = t Step 2 0 1 0 0 0 = s Embedded Tutorial: Memristive devices for computing: Beyond CMOS and Beyond von Neumann,, VLSI-SoC 2017, Abu Dahbi 23

Abschließendes Alle Module auch im Master verwendbar Module nicht abhängig voneinander () 26