AP II: Weiterentwicklung von LB-Methoden für Praktische Anwendungen auf Hochskalierenden Systemen
|
|
- Uwe Baumann
- vor 6 Jahren
- Abrufe
Transkript
1 AP II: Weiterentwicklung von LB-Methoden für Praktische Anwendungen auf Hochskalierenden Systemen C. Feichtinger Lehrstuhl für Informatik 10 (Systemsimulation) Universität Erlangen-Nürnberg www10.informatik.uni-erlangen.de SKALB-Abschlussworkshop Erlangen, 3. April
2 Projektbearbeiter LSS Christian Feichtinger: WaLBerla, Datenstruckturen, Parallelisierung, GPGPU, Perf. Modellierung Florian Schornbaum: Datenstruckturen, Dynamische Lastbalancierung, Adaptivität Stefan Donath: Parallelisierung, Checkpoint-Restart, Freie- Oberflächen Jan Götz: Parallelisierung, Checkpoint-Restart, Partikuläre Strömungen Dominik Bartuschat: WaLBerla, Parallelisierung Kristina Pickl: Parallele Auswertungen Frank Deserno: Datenreduktion Simon Bogner: Visualisierung, Freie-Oberflächen, Partikuläre Strömungen 2
3 AP II II.a: Datenstrukturen II.b: Gebietszerlegung und dynamische/adaptive Lastbalancierung II.b.1: Statische Gebietspartitionierung für große Gebiete unter Berücksichtigung von Hardware- Eigenschaften II.b.2: Dynamische / adaptive Lastbalancierung II.b.3: Adaptivität II.c: Preprocessing und Visualisierung II.d: Datenkompression und Restart-Mechanismen, MPI-IO 3
4 4
5 4
6 4
7 PHDs: WaLBerla 1 st generation: (2006) Klaus Iglberger Stefan Donath Jan Götz Christian Feichtinger 2 nd generation: (~2010) Dominik Bartuschat Kristina Pickel Florian Schornbaum Christian Godenschwager Johannes Habich (RRZE) Simon Bogner Felipe Aristizabal(McGill, Ca) 3 rd generation: (~2012) Regina Ammer Martin Bauer Daniela Anderl (LSTM) Matthias Markel (WTM) 5
8 PHDs: WaLBerla 1 st generation: (2006) Klaus Iglberger Stefan Donath Jan Götz Christian Feichtinger 2 nd generation: (~2010) Dominik Bartuschat Kristina Pickel Florian Schornbaum Christian Godenschwager Johannes Habich (RRZE) Simon Bogner Felipe Aristizabal(McGill, Ca) 3 rd generation: (~2012) Regina Ammer Martin Bauer Daniela Anderl (LSTM) Matthias Markel (WTM) Aktuelle Projekte: Simulation von Proteinschäumen, LSTM, LFG, DFG, FEI(AIF) FastEBM, WTM, EU Self-propelled Particle Complexes, EAM Simulation von Mykardperfusion, Siemens AG (Healthcare) Nano Fluids, McGill, Ca 5
9 Datenstrukturen Anforderungen: Dynamisch Lastbalanzierbar Adaptiv Verfeinerbar Spezialisierbar Skalierbar Performant Fünf unterschiedliche Datenstrukturansätze wurden evaluiert 6
10 Homogene Blöcke (LSS, irmb) 7
11 Heterogene Blöcke (LSS) Spezialisierung von Teilgebieten auf Hardware Aufbau anhand von Knotenbeschreibung Hybride Parallelisierung Statische Lastbalancierung Block{ } Hardware GPU; Load 240; Threads 1; Device 0; Block{ Hardware CPU; Load 40; Threads 5; } 8
12 Heterogene Blöcke (LSS) Spezialisierung von Teilgebieten auf Hardware Aufbau anhand von Knotenbeschreibung Hybride Parallelisierung Statische Lastbalancierung Block{ } Hardware GPU; Load 240; Threads 1; Device 0; Block{ Hardware CPU; Load 40; Threads 5; } 8
13 Dynamischer Oktree (LSS, irmb) 9
14 Patch-Block (irmb) 10
15 Patch-Block (irmb) 10
16 Patch-Block (irmb) 10
17 Patch-Block (irmb) 10
18 Patch-Block (irmb) 10
19 Listen-Basiert (RRZE) Speicherung der Fluid Zellen Geometrie und PDF Liste Optimal für statische Simulation 11
20 Anforderungen: Parallelisierung(WaLBerla) Minimierung des Parallelisierungsaufwands für neue Simulationsszenerien Geeignet für massive parallele Simulationen Puffermanagement und Ablaufsteuerung Geeignet für Heterogene Simulationen 12
21 Anforderungen: Parallelisierung(WaLBerla) Minimierung des Parallelisierungsaufwands für neue Simulationsszenerien Geeignet für massive parallele Simulationen Puffermanagement und Ablaufsteuerung Geeignet für Heterogene Simulationen 12
22 Anforderungen: Parallelisierung(WaLBerla) Minimierung des Parallelisierungsaufwands für neue Simulationsszenerien Geeignet für massive parallele Simulationen Puffermanagement und Ablaufsteuerung Geeignet für Heterogene Simulationen 12
23 Tsubame compute nodes equipped with GPUs 3 NVIDIA Tesla M2050 per node Peak performance: 2.2 PFlop/s 633 TB/s memory bandwidth Total performance: 2.4 PFlops/s 5 th in the TOP500 list Located at Tokyo Institute of Technology, Japan Collaboration with Prof. Takayuki Aoki 13
24 Pure LBM Performance on Tsubame 2 MLUPS: Mega Lattice Updates per Seconds Pure LBM performance is limited by bandwidth Implementation in CUDA Scenario: Lid Driven Cavity NVIDIA Tesla M2050 Xeon X5670 Westmere 2 sockets 12 cores Factor Flops [ TFlop/s ] 1,0 / 0,5 0,25/0,13 x 4 Theoretical Peak Bandwidth [GB/s] x 2-3 Stream Copy Bandwidth [GB/s] 100(+ECC)/ 115(-ECC) 43 x
25 Single GPU and CPU Node Performance Performance estimates based on Stream bandwidth: 15
26 Single GPU and CPU Node Performance Performance estimates based on Stream bandwidth: CPU: 142 MLUPS (ECC, DP, -BC) GPU: 330 MLUPS (ECC, DP, -BC) 15
27 Single GPU and CPU Node Performance Performance estimates based on Stream bandwidth: CPU: 142 MLUPS (ECC, DP, -BC) GPU: 330 MLUPS (ECC, DP, -BC) Resulting performance 75 % of estimate (+BC) 15
28 Single GPU and CPU Node Performance Performance estimates based on Stream bandwidth: CPU: 142 MLUPS (ECC, DP, -BC) GPU: 330 MLUPS (ECC, DP, -BC) Resulting performance 75 % of estimate (+BC) CPU Kernel: SSE Intrinsics Non-temporal stores Padding 15
29 Single GPU and CPU Node Performance Performance estimates based on Stream bandwidth: CPU: 142 MLUPS (ECC, DP, -BC) GPU: 330 MLUPS (ECC, DP, -BC) Resulting performance 75 % of estimate (+BC) CPU Kernel: SSE Intrinsics Non-temporal stores Padding GPU Kernel: Register usage optimized Memory layout: SoA Padding 15
30 Single GPU and CPU Node Performance Performance estimates based on Stream bandwidth: CPU: 142 MLUPS (ECC, DP, -BC) GPU: 330 MLUPS (ECC, DP, -BC) Resulting performance 75 % of estimate (+BC) CPU Kernel: SSE Intrinsics Non-temporal stores Padding GPU Kernel: Register usage optimized Memory layout: SoA Padding Kernels implemented by RRZE 15
31 Weak Scaling Performance Performance in [GLUPS] 180^3 Weak Scaling 3 GPUs GPGPUs 16
32 Weak Scaling Performance Performance in [GLUPS] 180^3 Weak Scaling 3 GPUs GPGPUs 16
33 Weak Scaling Performance Performance in [GLUPS] Weak Scaling 3 GPUs 180^ GPGPUs 16
34 Ziel: Performance Model for Parallel Simulations Besseres Verständnis des Kommunikationsoverheads Performancevorhersagen für WaLBerla Input: Bytes pro Nachricht und Anzahl der Nachrichten Bandbreiten abhängig von: Nachrichtengrösse Art des Transfers Hardware Bibliotheken Anzahl der Prozesse / Threads die sich eine Ressource teilen 17
35 Weak Scaling Performance Performance in [GLUPS] 180^3 Weak Scaling 3 GPUs Kernel Estimate Weak Scaling 3 GPUs GPGPUs 18
36 Weak Scaling Performance Performance in [GLUPS] 180^3 Weak Scaling 3 GPUs Kernel Estimate Weak Scaling 3 GPUs GPGPUs 18
37 Überlappen von Kommunikation und Arbeit 19
38 Überlappen von Kommunikation und Arbeit 20
39 Überlappen von Kommunikation und Arbeit 180^3 Performance in [GLUPS] Weak Scaling 3 GPUs Weak Scaling 3 GPUs (Overlap) Kernel Kernel (Overlap) Estimate Weak Scaling 3 GPUs GPGPUs 20
40 Weak Scaling Performance Performance in [GLUPS] Estimate 60^3 (Overlap) Estimate 100^3 (Overlap) Estimate 140^3 (Overlap) Estimate 180^3 (Overlap) Kernel 100^3 Kernel 60^ GPGPUs
41 Heterogene Node Performance Performance in [MLUPS] 1 GPU + 1 CPU 1 GPU 1 CPU Cubic Domain Size 1 GPU + 1 CPU 22
42 Weak Scaling - Vergleich der Ansätze Performance in [GLUPS] 180^3 Weak Scaling 3 GPUs - MPI (Overlap) Weak Scaling 3 GPUs - Hybrid (Overlap) Weak Scaling 3 GPUs - Hetero (Overlap) GPGPUs
43 Simulationen in Porösen Medien Performance-Evaluation Gebietsgrössen: 100x100x x256x3900 Voxelisierung: irmb Strong Scaling 24
44 Performance in [GLUPS] Simulationen in Porösen Medien 100x100x1504 Strong Scaling - Plain Strong Scaling - Geometry - LUPS Strong Scaling - Geometry - FLUPS Strong Scaling - Geometry - FLUPS (Overlap) Strong Scaling - CPU - FLUPS GPGPUs / CPU Nodes
45 Performance in [GLUPS] Simulationen in Porösen Medien 256x256x3900 Strong Scaling - 2D (Overlap) Strong Scaling - 1D (Overlap) GPGPUs / CPU Nodes 26
46 Prototyp für Dynamische Lastbalancierung Warum Entwicklung eines Prototype? Testen Large-Scale Partitionierungen auf dem Desktop Vereinfachtes Testen unterschiedlicher Ansätze Nicht Algorithmus spezifisch Qualitative Evaluierung Verifikation Beschreibungsmodell: Gebietsgröße Workload pro Block Bytes pro Block Kommunizierte Bytes pro Fläche, Kante und Ecke In der Entwicklung: Performancemodellierung Geplant: Open Source 27
47 Prototyp für Dynamische Lastbalancierung Initiale Lastverteiling: LSS: Raumfüllende Kurven oder Greedy Ansatz irmb: Metis oder Soltan Optimierungvariablen: Workload Speicher Kommunikation Optimierungstrategien: Anzahl der Prozesse Durchschnittliche Speichernutzung Lastverteilung 28
48 Prototyp für Dynamische Lastbalancierung Dynamische Lastbalancierung: Diffuse Lastbalanzierung Globale Lastbalanzierung, Master-Slave 29
49 Prototyp für Dynamische Lastbalancierung Anwendungsfall: Aufsteigende Blasen Prozesse Hauptspeicher pro Core 800 MB Blöcke: 40^3 30
50 Prototyp für Dynamische Lastbalancierung Anwendungsfall: Aufsteigende Blasen Prozesse Hauptspeicher pro Core 800 MB Blöcke: 40^3 31
51 Prototyp für Dynamische Lastbalancierung workload (in cells updated per coarsest time step) 5e+06 4e+06 3e+06 2e+06 1e+06 maximum average time step 32
52 Prototyp für Dynamische Lastbalancierung 600 maximum average 500 memory in MB time step 33
53 Prototyp für Dynamische Lastbalancierung workload and memory gain due to refinement workload gain memory gain time step 34
54 Thank you for your attention! Slides, reports, thesis, animations available for download at: www10.informatik.uni-erlangen.de 35
55 Thank you for your attention! Questions? Slides, reports, thesis, animations available for download at: www10.informatik.uni-erlangen.de 35
56 Thank you for your attention! Questions? Slides, reports, thesis, animations available for download at: www10.informatik.uni-erlangen.de 35
Fluid-Particle Multiphase Flow Simulations for the Study of Sand Infiltration into Immobile Gravel-Beds
3rd JUQUEEN Porting and Tuning Workshop Jülich, 2-4 February 2015 Fluid-Particle Multiphase Flow Simulations for the Study of Sand Infiltration into Immobile Gravel-Beds Tobias Schruff, Roy M. Frings,
MehrIntroduction Workshop 11th 12th November 2013
Introduction Workshop 11th 12th November 2013 Lecture I: Hardware and Applications Dr. Andreas Wolf Gruppenleiter Hochleistungsrechnen Hochschulrechenzentrum Overview Current and next System Hardware Sections
MehrThe Third Pillar for 21st Century Science
Zur Konzeption eines Zentralinstituts Scientific Computing ZISC an der FAU Erlangen-Nürnberg The Third Pillar for 21st Century Science U. Rüde Lehrstuhl für Informatik 10 (Systemsimulation) Universität
MehrGrid generation and external aerodynamics of the DrivAer model with LBM
Platzhalter für Bild, Bild auf Titelfolie hinter das Logo einsetzen of the DrivAer model with LBM 24th September 2014 Andrea Pasquali, Martin Schönherr, Martin Geier, Manfred Krafczyk Presentation of the
MehrBibliotheks-basierte Virtualisierung
Dr.-Ing. Volkmar Sieh Department Informatik 4 Verteilte Systeme und Betriebssysteme Friedrich-Alexander-Universität Erlangen-Nürnberg WS 2015/2016 V. Sieh Bibliotheks-basierte Virtualisierung (WS15/16)
MehrDas Prinzip der kleinsten Überraschung Konfiguration des neuen HPC-Clusters am RRZ
Das Prinzip der kleinsten Überraschung Konfiguration des neuen HPC-Clusters am RRZ Hinnerk Stüben ZKI-Arbeitskreis Supercomputing Leibniz-Rechenzentrum, Garching 19. Oktober 2015 Themen Neues HPC-Cluster
MehrTecNews: Sandy Bridge
TecNews: Sandy Bridge Werner Fischer, Technology Specialist Thomas-Krenn.AG Thomas Krenn Herbstworkshop & Roadshow 2011 23.09. in Freyung 06.10. in Wien (A) 10.10. in Frankfurt 11.10. in Düsseldorf 12.10.
MehrPraxiseinheit: Realisierung einer hardwarebeschleunigten Disparitätenberechnung zur automatischen Auswertung von Stereobildern
Praxiseinheit: Realisierung einer hardwarebeschleunigten Disparitätenberechnung zur automatischen Auswertung von Stereobildern Institut für Betriebssysteme und Rechnerverbund TU Braunschweig 25.10., 26.10.
MehrOpenCL. OpenCL. Boris Totev, Cornelius Knap
OpenCL OpenCL 1 OpenCL Gliederung Entstehungsgeschichte von OpenCL Was, warum und überhaupt wieso OpenCL CUDA, OpenGL und OpenCL GPUs OpenCL Objekte Work-Units OpenCL Adressbereiche OpenCL API Codebeispiel
MehrGames with Cellular Automata auf Parallelen Rechnerarchitekturen
Bachelor Games with Cellular Automata auf Parallelen en ( ) Dipl.-Inf. Marc Reichenbach Prof. Dietmar Fey Ziel des s Paralleles Rechnen Keine akademische Nische mehr Vielmehr Allgemeingut für den Beruf
MehrOrientierungsveranstaltungen 2009 Informatikstudien der Universität Wien
Orientierungsveranstaltungen 2009 Informatikstudien der Universität Wien Scientific Computing 07. Oktober 2009 Siegfried Benkner Wilfried Gansterer Fakultät für Informatik Universität Wien www.cs.univie.ac.at
MehrMulticore-Architekturen
Universität Erlangen- Nürnberg Technische Universität München Universität Stuttgart Multicore-Architekturen Vortrag im Rahmen der Ferienakademie 2009 Kurs 1: Programmierkonzepte für Multi-Core Rechner
Mehrtechnische universität dortmund Lehrstuhl für Hochfrequenztechnik Übertragungssysteme
Lehrstuhl für Hochfrequenztechnik GPU-beschleunigte numerische Simulation faseroptischer Übertragungssysteme, Marius Helf, Peter Krummrich Übersicht Motivation Split-Step p Fourier Methode Ansätze für
MehrEXASOL @ Symposium on Scalable Analytics. www.exasol.com. Skalierbare Analysen mit EXASolution
EXASOL @ Symposium on Scalable Analytics Skalierbare Analysen mit EXASolution EXASOL AG Wer sind wir R&D: + seit 2000 + laufend Forschungsprojekte Produkt: Analytische Datenbank EXASolution Focus auf Komplexität
MehrCoupling GIS and hydraulics using the example of the Dornbirnerach
Coupling GIS and hydraulics using the example of the Dornbirnerach Michaela Jud Department for Geoinformatics Technical University of Munich (TUM), Germany San Diego, 13 th of July 2011 Storm event august
MehrGPGPUs am Jülich Supercomputing Centre
GPGPUs am Jülich Supercomputing Centre 20. April 2012 Jochen Kreutz Jülich Supercomputing Centre (JSC) Teil des Forschungszentrums Jülich und des Institute for Advanced Simulation (IAS) betreibt Supercomputer
MehrProtected User-Level DMA in SCI Shared Memory Umgebungen
Protected User-Level DMA in SCI Shared Memory Umgebungen Mario Trams University of Technology Chemnitz, Chair of Computer Architecture 6. Halle Chemnitz Seminar zu Parallelverarbeitung und Programmiersprachen
MehrAktuelle Trends und Herausforderungen in der Finite-Elemente-Simulation
Aktuelle Trends und Herausforderungen in der Finite-Elemente-Simulation Kai Diethelm GNS Gesellschaft für numerische Simulation mbh Braunschweig engineering software development Folie 1 Überblick Vorstellung
MehrJunction of a Blended Wing Body Aircraft
Topology Optimization of the Wing-Cabin Junction of a Blended Wing Body Aircraft Bin Wei M.Sc. Ögmundur Petersson M.Sc. 26.11.2010 Challenge of wing root design Compare to conventional aircraft: Improved
MehrKingston Technology WHD. November 30, 2012. Andreas Scholz, BDM Integration und Server D-A
Kingston Technology WHD Andreas Scholz, BDM Integration und Server D-A November 30, 2012 Agenda Trends Speicher Konfigurationen Warum KingstonConsult? KingstonConsult Speicher Bandbreite: balanced vs.
MehrA closer look at the M/G/R PS model for TCP traffic
A closer look at the M/G/R PS model for TCP traffic July 23, 2001 Institute of Communication etworks Munich University of Technology 1 Outline Simulation Scenario Sojourn Time Formulas Investigated Scenarios
MehrXEN Performance. Projektpraktikum Informatik. Arne Klein 2008-02-26. Arne Klein () XEN Performance 2008-02-26 1 / 25
XEN Performance Projektpraktikum Informatik Arne Klein 2008-02-26 Arne Klein () XEN Performance 2008-02-26 1 / 25 1 Virtualisierung mit XEN 2 Performance von XEN Allgemeines Netzwerk-Performance IO-Performance
MehrGrafikkarten-Architektur
> Grafikkarten-Architektur Parallele Strukturen in der GPU Name: Sebastian Albers E-Mail: s.albers@wwu.de 2 > Inhalt > CPU und GPU im Vergleich > Rendering-Pipeline > Shader > GPGPU > Nvidia Tesla-Architektur
MehrLattice Boltzmann Simulation bewegter Partikel
Lattice Boltzmann Simulation bewegter Partikel, Nils Thürey, Hans-Joachim Schmid, Christian Feichtinger Lehrstuhl für Systemsimulation Universität Erlangen/Nürnberg Lehrstuhl für Partikeltechnologie Universität
MehrGPGPU mit NVIDIA CUDA
01.07.12 GPGPU mit NVIDIA CUDA General-Purpose on Formatvorlagecomputing des Graphics Processing durch Units Untertitelmasters mit KlickenCompute bearbeiten NVIDIA Unified Device Architecture Gliederung
MehrCluster Operating Systems
Lehrstuhl für Rechnerarchitektur, Professor Brüning Cluster Operating Systems Seminarvortrag im Wintersemester 2003/04 von Frank Ueltzhöffer 1. Einführung und Motivation 2. Charakterisierung 3. Herausforderungen
MehrTitelmasterformat durch Klicken bearbeiten
Titelmasterformat durch Klicken Titelmasterformat durch Klicken Huawei Enterprise Server Systeme Global Player auf dem Server- und Storagemarkt Scale up Übersicht Titelmasterformat durch Klicken Textmasterformat
MehrTag der Umweltmeteorologie 12.05.2015. Michael Kunz
Tag der Umweltmeteorologie 12.05.2015 Michael Kunz Beschleunigung von Ausbreitungsmodellen durch Portierung auf Grafikkarten Einleitung Das GRAL/GRAMM-System Cuda-GRAL Ergebnisse Vergleich der Modellergebnisse
MehrIdeas for cooperative software development for future GGOS stations
Ideas for cooperative software development for future GGOS stations (FESG) neidhardt@fs.wettzell.de Martin Ettl (FESG) ettl@fs.wettzell.de 1 Scientific Software - Tendency to become complex and unstructured
MehrMulticore Herausforderungen an das Software-Engineering. Prof. Dr.-Ing. Michael Uelschen Hochschule Osnabrück 15.09.2010
Multicore Herausforderungen an das Software-Engineering Prof. Dr.-Ing. Michael Uelschen Hochschule Osnabrück 15.09.2010 Inhalt _ Motivation _ Herausforderung 1: Hardware _ Herausforderung 2: Software-Partitionierung
MehrEinleitung. Komplexe Anfragen. Suche ist teuer. VA-File Verfeinerungen. A0-Algo. GeVAS. Schluß. Folie 2. Einleitung. Suche ist teuer.
Anwendung Input: Query-Bild, Ergebnis: Menge ähnlicher Bilder. Kapitel 8: Ähnlichkeitsanfragen und ihre effiziente Evaluierung Wie zu finden? Corbis, NASA: EOS Bilddatenbank Folie Folie 2 Ähnlichkeitssuche
MehrDie deutsche Windows HPC Benutzergruppe
Christian Terboven, Dieter an Mey {terboven, anmey}@rz.rwth aachen.de Rechen und Kommunikationszentrum RWTH Aachen Windows HPC Server Launch 16. Oktober, Frankfurt am Main Agenda o Hochleistungsrechnen
MehrPerformant Rendern mit Solidworks Visualize und PNY
Performant Rendern mit Solidworks Visualize und PNY Bechtle- Solidworks Experience Day Neckarsulm, 30.09.2016 Michael Rabinovici, Key Account Manager CE Warum PNY Agenda Grafikkarten und GPU Hardware Software
MehrUntersuchung und Vorstellung moderner Grafikchiparchitekturen
Fakultät Informatik, Institut für Technische Informatik, Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur Untersuchung und Vorstellung moderner Grafikchiparchitekturen Hauptseminar Technische
MehrEin kleiner Einblick in die Welt der Supercomputer. Christian Krohn 07.12.2010 1
Ein kleiner Einblick in die Welt der Supercomputer Christian Krohn 07.12.2010 1 Vorschub: FLOPS Entwicklung der Supercomputer Funktionsweisen von Supercomputern Zukunftsvisionen 2 Ein Top10 Supercomputer
MehrDie Sandy-Bridge Architektur
Fakultät Informatik - Institut für Technische Informatik - Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur Die Sandy-Bridge Architektur René Arnold Dresden, 12. Juli 2011 0. Gliederung 1.
MehrM5000 einfach ablösen durch T4/T5 LDoms und Solaris Zonen
M5000 einfach ablösen durch T4/T5 LDoms und Solaris Zonen Marcel Hofstetter hofstetter@jomasoft.ch CEO, Mitgründer, Enterprise Consultant JomaSoft GmbH 1 Inhalt Wer ist JomaSoft? SPARC T5 CPU Neue T5-x
MehrCloud-Computing. 1. Definition 2. Was bietet Cloud-Computing. 3. Technische Lösungen. 4. Kritik an der Cloud. 2.1 Industrie 2.
Cloud Computing Frank Hallas und Alexander Butiu Universität Erlangen Nürnberg, Lehrstuhl für Hardware/Software CoDesign Multicorearchitectures and Programming Seminar, Sommersemester 2013 1. Definition
MehrSeminar GPU-Programmierung/Parallelverarbeitung
Seite iv Literaturverzeichnis 1) Bengel, G.; et al.: Masterkurs Parallele und Verteilte Systeme. Vieweg + Teubner, Wiesbaden, 2008. 2) Breshears, C.: The Art of Concurrency - A Thread Monkey's Guide to
MehrBig Data in der Forschung
Big Data in der Forschung Dominik Friedrich RWTH Aachen Rechen- und Kommunikationszentrum (RZ) Gartner Hype Cycle July 2011 Folie 2 Was ist Big Data? Was wird unter Big Data verstanden Datensätze, die
MehrBenchmarking und Performancetesting von und mit PostgreSQL
Benchmarking und Performancetesting von und mit PostgreSQL Stefan Kaltenbrunner stefan@kaltenbrunner.cc http://www.kaltenbrunner.cc/blog PGDay.EU 2010 Stuttgart, Germany 1 Die Datenbank ist langsam...
MehrThema: Hardware-Shader
Seminar Grafikprogrammierung Thema: Hardware-Shader Christian Bauer 03.07.08 Überblick Entwicklung Die Shader im Detail Programmierung GPGPU Zusammenfassung & Ausblick 1/19 Entwicklung (1) Früher: Berechnung
MehrWie profitiert SAP MaxDB von SSD Technologie?
Wie profitiert SAP MaxDB von SSD Technologie? Direktor Software und Services SAP MaxDB InfoTage 2014 15.-25. September 2014 Purpose Agenda MaxDB ENTERPRISE EDITION Including Mobile DB Monitor MaxDB & SSD
MehrMULTICORE- UND GPGPU- ARCHITEKTUREN
MULTICORE- UND GPGPU- ARCHITEKTUREN Korbinian Pauli - 17. November 2011 Seminar Multicore Programmierung, WS11, Universität Passau 2 Einleitung Klassisches Problem der Informatik: riesige Datenmenge! Volkszählung
MehrGPGPU-Architekturen CUDA Programmiermodell Beispielprogramm Organiosatorisches. Tutorial CUDA. Ralf Seidler
Friedrich-Alexander-Universität Erlangen-Nürnberg 05.10.2010 Outline 1 GPGPU-Architekturen 2 CUDA Programmiermodell 3 Beispielprogramm 4 Organiosatorisches Outlook 1 GPGPU-Architekturen 2 CUDA Programmiermodell
MehrVirtualisierung: Neues aus 2010 und Trends 2011
Virtualisierung: Neues aus 2010 und Trends 2011 Werner Fischer, Technology Specialist Thomas-Krenn.AG Thomas Krenn Herbstworkshop 2010 Freyung, 24. September 2010 Agenda 1) Virtualisierungs-Software VMware
MehrOracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen
DATA WAREHOUSE Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen Alfred Schlaucher, Detlef Schroeder DATA WAREHOUSE Themen Big Data Buzz Word oder eine neue Dimension
MehrWakefield computation of PETRAIII taper section Laura Lünzer
Wakefield computation of PETRAIII taper section Laura Lünzer 16. Dezember 2011 TU Darmstadt Fachbereich 18 Institut Theorie Elektromagnetischer Felder Laura Lünzer Geometry of tapered structure Undulator
MehrEchtzeitverhalten durch die Verwendung von CPU Stubs: Eine Erweiterung von Dynamic Performance Stubs. Echtzeit 2009
Echtzeitverhalten durch die Verwendung von CPU Stubs: Eine Erweiterung von Dynamic Performance Stubs Echtzeit 2009 Peter Trapp, 20.11.2009 Übersicht 1 Einleitung 2 (Übersicht) 3 (Framework) 4 Methodik
MehrPostgreSQL auf vielen CPUs. Hans-Jürgen Schönig Hans-Jürgen Schönig
PostgreSQL auf vielen CPUs Ansätze zur Skalierung PostgreSQL auf einer CPU Traditionell läuft eine Query auf nur einer CPU Historisch gesehen war das kein Problem Mittlerweile ist das ein großes Problem
Mehr5.3.2.16 Laborübung - Verwalten von virtuellem Speicher in Windows 7
5.0 5.3.2.16 Laborübung - Verwalten von virtuellem Speicher in Windows 7 Einführung Drucken Sie diese Übung aus und folgen Sie den Anweisungen. In dieser Übung werden Sie die Einstellungen des virtuellen
MehrOutline. Cell Broadband Engine. Application Areas. The Cell
Outline 21.March 2006 Benjamin Keck Why Cell?!? Application Areas Architectural Overview Programming Model Programming on the PPE C/C++ Intrinsics 1 2 The Cell Supercomputer on a chip Multi-Core Microprocessor
MehrMeteorological measurements at the Offshore Platform FINO 2 - new insights -
FINO 2011 Conference May 11 th 2011, Hamburg, Germany Meteorological measurements at the Offshore Platform FINO 2 - new insights - Dipl.-Geoök. Stefan Müller, Dipl.-Ing Joachim Schwabe Content 1. FINO
MehrAutomation Universities 2016 AUL21 - Entdecken Sie die wichtigsten Vorteile einer erweiterten Bedienstation
Automation Universities 2016 AUL21 - Entdecken Sie die wichtigsten einer erweiterten Bedienstation 5058-CO900H Accelerating Industrial Performance 5058-CO900H The Connected Enterprise Integration von Steuerung
MehrEingebettete Taktübertragung auf Speicherbussen
Eingebettete Taktübertragung auf Speicherbussen Johannes Reichart Workshop Hochgeschwindigkeitsschnittstellen Stuttgart, 07.11.2008 Unterstützt durch: Qimonda AG, München Institut für Prof. Elektrische
MehrCAE in der Cloud. - Vorteile & Probleme - Wolfgang Gentzsch & Burak Yenier ISC @ CeBIT, 19. März 2015
CAE in der Cloud - Vorteile & Probleme - Wolfgang Gentzsch & Burak Yenier ISC @ CeBIT, 19. März 2015 CAE in der Cloud - Vorteile & Probleme - Wolfgang Gentzsch & Burak Yenier ISC @ CeBIT, 19. März 2015
MehrGIS-based Mapping Tool for Urban Energy Demand
GIS-based Mapping Tool for Urban Energy Demand Building Services, Mechanical and Building Industry Days Conference Johannes Dorfner Debrecen, 14 October 2011 Outline 1. Motivation 2. Method 3. Result 4.
MehrOracle EngineeredSystems
Oracle EngineeredSystems Überblick was es alles gibt Themenübersicht Überblick über die Engineered Systems von Oracle Was gibt es und was ist der Einsatzzweck? Wann machen diese Systeme Sinn? Limitationen
Mehroscan ein präemptives Echtzeit-Multitasking-Betriebssystem
ein präemptives Echtzeit-Multitasking-Betriebssystem 2011. Vector Informatik GmbH. All rights reserved. Any distribution or copying is subject to prior written approval by Vector. V0.9 2011-10-12 Management
MehrSoftware Engineering für moderne, parallele Plattformen
Software Engineering für moderne, parallele Plattformen b. Ergänzungen zur Performanz Dr. Victor Pankratius Dr. Victor Pankratius IPD Lehrstuhl für Programmiersysteme-Tichy KIT die Kooperation von Forschungszentrum
MehrXcalibur-2 Alpha. Time. Christian Rempis University of Applied Sciences Bonn-Rhein-Sieg 17. Januar 2006 1
Time Christian Rempis University of Applied Sciences Bonn-Rhein-Sieg 17. Januar 2006 1 Control and Command Environment for a Robotic Experimenter R&D 1 Examination Presentation by Christian Rempis Christian
MehrDarstellung komplexer 3D-Stadtmodelle im (mobilen) Webbrowser mittels bildbasiertem Rendering
Darstellung komplexer 3D-Stadtmodelle im (mobilen) Webbrowser mittels bildbasiertem Rendering Martin Christen FHNW Hochschule für Architektur, Bau und Geomatik Institut Vermessung und Geoinformation martin.christen@fhnw.ch
MehrTobias Flohre / Dennis Schulte codecentric AG. Spring Batch Performance und Skalierbarkeit
Tobias Flohre / Dennis Schulte Spring Batch Performance und Skalierbarkeit Dennis Schulte Düsseldorf @denschu www.github.com/denschu blog.codecentric.de/author/dsc tel +49 (0) 1515 _ 288 2395 dennis.schulte@codecentric.de
MehrDesign and Implementation of a Soft-error Resilient OSEK Real-time Operating System
Design and Implementation of a Soft-error Resilient OSEK Real-time Operating System Florian Lukas Lehrstuhl für Informatik 4 Verteilte Systeme und Betriebssysteme Friedrich Alexander Universität Erlangen
MehrExascale Computing. = Exascale braucht Manycore-Hardware...und was für Software??? 46/58
Exascale Computing Die FLOP/s-Tabelle: Name Faktor erreicht heute Giga 10 9 1976 CPU-Kern Tera 10 12 1997 Graphikkarte (GPU) Peta 10 15 2009 Supercomputer Exa 10 18 2020(?) Der gegenwärtig schnellste Rechner
MehrLattice Boltzmann Study of the Drag Correlation in Dilute and Moderately Dense Fluid-Particle Systems
Lattice Boltzmann Study of the Drag Correlation in Dilute and Moderately Dense Fluid-Particle Systems Simon Bogner, Swati Mohanty1 and Ulrich Rüde Chair for System Simulation (LSS), University of Erlangen-Nürnberg,
MehrProgrammierung von Graphikkarten
Programmierung von Graphikkarten Stefan Lang Interdisziplinäres Zentrum für Wissenschaftliches Rechnen Universität Heidelberg INF 368, Raum 532 D-69120 Heidelberg phone: 06221/54-8264 email: Stefan.Lang@iwr.uni-heidelberg.de
MehrAufbau eines VR-Systems zur multimodalen Interaktion mit komplexen physikalischen Modellen
Fazit Aufbau eines s zur multimodalen Interaktion mit komplexen physikalischen Modellen Guido Rasmus Maximilian Klein, Franz-Erich Wolter Leibniz Universität Hannover Institut für Mensch-Maschine-Kommunikation
MehrDie beste Infrastruktur ist nur so schnell, wie der Code der darauf läuft. Fallbeispiel Wettervorhersage
Die beste Infrastruktur ist nur so schnell, wie der Code der darauf läuft Fallbeispiel Wettervorhersage VPE Swiss Workshop, HSR 24. Januar 2013 David Müller, Tobias Gysi Vision trifft Realität. Supercomputing
MehrCell Broadband Engine
Cell Broadband Engine 21.March 2006 Benjamin Keck Outline Why Cell?!? Application Areas Architectural Overview SPU Programming Model Programming on the PPE C/C++ Intrinsics The Cell Supercomputer on a
MehrSelf-aware Memory: Hardware-Prototyp eines Prozessorknotens
Self-aware Memory: Hardware-Prototyp eines Prozessorknotens Robert Schelkle Universität Karlsruhe (TH) Institut für Technische Informatik (ITEC) Lehrstuhl für Rechnerarchitektur 24. März 2009 Robert Schelkle
MehrXenologie oder wie man einen Plastikmainframe baut
Xenologie oder wie man einen Plastikmainframe baut Alexander Schreiber http://www.thangorodrim.de/ Chemnitzer Linux-Tage 2006 I think there is a world market for maybe five computers.
MehrHochleistungsrechnen Hybride Parallele Programmierung. Prof. Dr. Thomas Ludwig Universität Hamburg Informatik Wissenschaftliches Rechnen
Hochleistungsrechnen Hybride Parallele Programmierung Prof. Dr. Thomas Ludwig Universität Hamburg Informatik Wissenschaftliches Rechnen Inhaltsübersicht Einleitung und Motivation Programmiermodelle für
MehrHLRN III - HPC Ressource für Norddeutschland
HLRN III - HPC Ressource für Norddeutschland Holger Naundorf RRZN Leibniz Universität IT Services Schloßwender Straße 5 30159 Hannover naundorf@rrzn.uni-hannover.de 23. September 2014 Inhalt Der HLRN Verbund
MehrAccelerator physics at TU Darmstadt/TEMF
Accelerator physics at TU Darmstadt/TEMF Institut Theorie Elektromagnetischer Felder (TEMF) Computational Electromagnetics Laboratory 11. Dezember 2013 TU Darmstadt Fachbereich 18 Institut Theorie Elektromagnetischer
MehrMesh-Visualisierung. Von Matthias Kostka. Visualisierung großer Datensätze
Mesh-Visualisierung Von Matthias Kostka Übersicht Einführung Streaming Meshes Quick-VDR Rendering virtueller Umgebung Rendering mit PC-Clustern Zusammenfassung 2 Mesh Untereinander verbundene Punkte bilden
MehrAusblick auf den HLRN III - die neue HPC Ressource für Norddeutschland
Ausblick auf den HLRN III - die neue HPC Ressource für Norddeutschland Holger Naundorf RRZN Leibniz Universität IT Services Schloßwender Straße 5 30159 Hannover naundorf@rrzn.uni-hannover.de 14. März 2013
MehrWAVE: Eine portable HPC-toolbox zur Simula:on und Inversion von Wellenfeldern. Ins:tut für theore:sche Informa:k Geophysikalisches Ins:tut
WAVE: Eine portable HPC-toolbox zur Simula:on und Inversion von Wellenfeldern Ins:tut für theore:sche Informa:k Geophysikalisches Ins:tut Übersicht Mo:va:on Methodik Performance Ausblick 29.11.2016 6.
Mehr30 KJ für 100 GB: Energieeffizientes Sortieren. Ulrich Meyer
30 KJ für 100 GB: Energieeffizientes Sortieren Ulrich Meyer Professur Algorithm Engineering Woche der Informatik - Feb. 2010 30 KJ für 100 GB: Energieeffizientes Sortieren Ulrich Meyer p. 1 Green Computing
MehrHow-To-Do. Hardware Configuration of the CC03 via SIMATIC Manager from Siemens
How-To-Do Hardware Configuration of the CC03 via SIMATIC Manager from Siemens Content Hardware Configuration of the CC03 via SIMATIC Manager from Siemens... 1 1 General... 2 1.1 Information... 2 1.2 Reference...
MehrCUDA 3230 GPU-COMPUTE NODE, KEPLER READY
CUDA 3230 GPU-COMPUTE NODE, KEPLER READY II 1HE Rackmount II Dual Intel Xeon Processor E5-2600 v3 Serie (Haswell EP) II max. 1 TB Hauptspeicher (LRDIMM) II max. 8 TB Speicher II 3 NVIDIA Tesla GPUs der
MehrFPGA Beschleuniger. Your Name. Armin Jeyrani Mamegani Your Organization (Line #2)
FPGA Beschleuniger 15.12.2008 Armin Jeyrani Mamegani Your Name HAW Hamburg Your Title Department Your Organization Informatik (Line #1) Your Organization (Line #2) Einleitung Wiederholung aus AW1: Handy
MehrLatency Scenarios of Bridged Networks
Latency Scenarios of Bridged Networks Christian Boiger christian.boiger@hdu-deggendorf.de Real Time Communication Symposium January 2012 Munich, Germany D E G G E N D O R F U N I V E R S I T Y O F A P
MehrOptimierung eines neuen Logarithmic-Search-Verfahrens zum Image Mosaicing unter Einsatz des CUDA-Frameworks
Fachhochschule Köln, Campus Gummersbach Optimierung eines neuen Logarithmic-Search-Verfahrens zum Image Mosaicing unter Einsatz des CUDA-Frameworks 03.06.2009 Eugen Sewergin, B. Sc. Erstprüfer: Prof. Dr.
MehrTransparente Nutzung von Multi-GPU Cluster unter Java/OpenMP
Transparente Nutzung von Multi-GPU Cluster unter Java/OpenMP Dipl. Inf. Thorsten Blaß Programming Systems Group Martensstraße 3 91058 Erlangen Ausblick Motivation Einführung Java/OpenMP (JaMP) JaMP Sprache
MehrTechnische Voraussetzungen
Technische Voraussetzungen Um NewMoove Videos abspielen zu können, müssen dein Computer und deine Internetverbindung bestimmte Anforderungen erfüllen. Hier findest du alles - übersichtlich aufbereitet
MehrCitrix XenDesktopHDX 3D Pro
Citrix XenDesktopHDX 3D Pro Johannes Steinemann Teamleiter IT-Solutions/Virtualisierung Geschäftsmodell der encadconsulting Die encadconsultingversteht CAD-Installationsumgebungen nicht als abgegrenzte
MehrSlothful Linux: An Efficient Hybrid Real-Time System by Hardware-Based Task Dispatching. Rainer Müller
Slothful Linux: An Efficient Hybrid Real-Time System by Hardware-Based Task Dispatching Rainer Müller 21. November 2013 Spezialisierung von Betriebssystemen Vielzweckbetriebssysteme (General Purpose OS,
MehrInstruktionssatz-Architektur
Institut für Informatik 3: Rechnerarchitektur Friedrich-Alexander-Universität Erlangen-Nürnberg WS 2005/2006 Übersicht 1 Einleitung 2 Bestandteile der ISA 3 CISC / RISC Übersicht 1 Einleitung 2 Bestandteile
MehrPraktikum Entwicklung Mediensysteme (für Master)
Praktikum Entwicklung Mediensysteme (für Master) Organisatorisches Today Schedule Organizational Stuff Introduction to Android Exercise 1 2 Schedule Phase 1 Individual Phase: Introduction to basics about
MehrHow-To-Do. Hardware Configuration of the CPU 317NET with external CPs on the SPEED Bus by SIMATIC Manager from Siemens
How-To-Do Hardware Configuration of the CPU 317NET with external CPs on the SPEED Bus by SIMATIC Manager from Siemens Content Hardware Configuration of the CPU 317NET with external CPs on the SPEED Bus
MehrHANA Solution Manager als Einstieg
Markus Stockhausen HANA Solution Manager als Einstieg Collogia Solution Day Hamburg 28.04.2016 Agenda HANA Solution Manager als Einstieg 1 Überblick 2 Techniken 3 Sizing Collogia Unternehmensberatung AG,
MehrFSJS- X3000. Corsair AX1200 Gold. Asus P6T7 Mainboard. Corsair (3x4GB RAM) MSI GTX 780. Intel Core i7-990x
Lehrlingswettbewerb Züri Oberland 2013 Uster Ausbildungszentrum Zürcher Oberland Corsair AX1200 Gold CO 2 -refrigeriertes Liquid- Thermotransfer- Zirkulationssystem Asus P6T7 Mainboard FSJS- X3000 Corsair
MehrExcel beschleunigen mit dem mit Windows HPC Server 2008 R2
Excel beschleunigen mit dem mit Windows HPC Server 2008 R2 Steffen Krause Technical Evangelist Microsoft Deutschland GmbH http://blogs.technet.com/steffenk Haftungsausschluss Microsoft kann für die Richtigkeit
MehrThinkStation P-Series Anwendungsbreiche
39 ThinkStation P-Series Anwendungsbreiche Thinkstation Vertikale Lösungen Öl & Gas Produktentwicklung Media & Entertainment Finanz, Wertpapierhandel Medizin & Forschung 40 2014 LENOVO INTERNAL. ALL RIGHTS
MehrInternationale Energiewirtschaftstagung TU Wien 2015
Internationale Energiewirtschaftstagung TU Wien 2015 Techno-economic study of measures to increase the flexibility of decentralized cogeneration plants on a German chemical company Luis Plascencia, Dr.
MehrOne of the few resources increasing faster than the speed of computer hardware is the amount of data to be processed. Bin Hu
Bin Hu Algorithmen und Datenstrukturen 2 Arbeitsbereich fr Algorithmen und Datenstrukturen Institut fr Computergraphik und Algorithmen Technische Universität Wien One of the few resources increasing faster
MehrAlgorithms for graph visualization
Algorithms for graph visualization Project - Orthogonal Grid Layout with Small Area W INTER SEMESTER 2013/2014 Martin No llenburg KIT Universita t des Landes Baden-Wu rttemberg und nationales Forschungszentrum
MehrHochleistungsberechnungen für Industrie und Weltraum
Christian Federspiel Hochleistungsberechnungen für Industrie und Weltraum christian.federspiel@catalysts.at Stagnation seit 2005 Performance Parameter Entwicklung von 2005-2020 Taktfrequenz L1 / L2 Cache
MehrNEC SX-ACE HPC-System
Erste Erfahrungen mit dem neuen System Dr. Simone Knief; ZKI-Arbeitskreis Supercomputing, Kiel 17.03.2015 1 Überblick Rechnerkonfiguration Veränderungen SX-9 zu SX-ACE Benutzergruppen Erste Performanceergebnisse
Mehr