Hochleistungsrechnen mit Windows Verifikations- und Analyseprogramme Christian Terboven Rechen- und Kommunikationszentrum RWTH Aachen

Ähnliche Dokumente
Hochleistungsrechnen mit Windows Interaktive Benutzung und das Batchsystem Christian Terboven Rechen- und Kommunikationszentrum RWTH Aachen

Hochleistungsrechnen mit Windows Visual Studio Intel Compiler Christian Terboven Rechen- und Kommunikationszentrum RWTH Aachen

C C. Hochleistungsrechnen (HPC) auf dem Windows Compute Cluster des RZ der RWTH Aachen. 1 WinHPC Einführung Center. 31.

Game Engine Architecture and Development. Platform Unabhängiger Code Multi Threading in Game Engines Profiling

MPI-Programmierung unter Windows mit MPICH2. Installieren von MPICH2, Übersetzen, Ausführen und Debuggen von MPI-Programmen. Christian Terboven

Intel Cluster Studio. Michael Burger FG Scientific Computing TU Darmstadt

RZ.RWTH-AACHEN.DE

Die deutsche Windows HPC Benutzergruppe

INDEX. Netzwerk Überblick. Benötigte Komponenten für: Windows Server Windows Server 2008 R2. Windows Server 2012

OpenMP am Beispiel der Matrizenmultiplikation

Wodis Sigma Inhouse Systemanforderungen

Parallele Programmierung mit OpenMP

Effizientes Memory Debugging in C/C++

Systemvoraussetzungen

Oracle EngineeredSystems

Parallele Systeme. 1 Einführung Durchführung der erweiterten Übung OpenMP... 3

- info@hocomputer.de - Tel: (+49) / 0221 /

ASUS - LENOVO - TOSHIBA FUJITSU - HP. Notebook Preisliste. Sept !!!

Virtualisierung: Neues aus 2010 und Trends 2011

Smartphone Entwicklung mit Android und Java

Systemanforderungen. Finanzbuchführung. Anlagenbuchführung. Kostenrechnung. Personalwirtschaft

Parallele Programmierung mit OpenMP

Systemanforderungen Verlage & Akzidenzdruck

Ferienakademie Programmierkonzepte für Multi-Core Rechner. Tools: Profiler

Hochleistungsrechnen Hybride Parallele Programmierung. Prof. Dr. Thomas Ludwig Universität Hamburg Informatik Wissenschaftliches Rechnen

Installation - Optimierung und Fehleranalyse

Anleitung für zwei C++ - Openmp - Beispiele auf der NWZSuperdome

SCHEIDBACH Computerhandel KG EDV-FACHBETRIEB MIT PERSÖNLICHER BERATUNG ASUS - LENOVO - TOSHIBA FUJITSU - HP. Notebook Preisliste. JUNI/Juli ***

Windows HPC Server 2008 aus der Betreiberperspektive

Schriftgut- und Informationsverwaltung. Anleitung BürgerTOP

Nutzung paralleler Prozesse bei der Umweltsimulation

Agenda. Einleitung Produkte vom VMware VMware Player VMware Server VMware ESX VMware Infrastrukture. Virtuelle Netzwerke

SAPGUI-Installation. Windows Bit-Edition auf x64 (AMD) und Intel EM64T (nur die Editionen

Systemvoraussetzungen. Titel

Client: min. Intel Pentium IV oder höher bzw. vergleichbares Produkt

Windows Server 2008 Virtualisierung. Referent: Marc Grote

Was ist PretonSaverTM... 3 PretonSaver's... 3 PretonCoordinator... 3 PretonControl... 4 PretonSaver Client... 4 PretonSaver TM Key Funktionen...

4. Parallelprogrammierung

WINDOWS 7 (32 o 64 bit)

Dieses Dokument beschreibt die Installation des Governikus Add-In for Microsoft Office (Governikus Add-In) auf Ihrem Arbeitsplatz.

Inhaltsangabe zu den Systemvoraussetzungen:

Parallels Desktop für Mac. Entdecke Parallels Desktop für Mac

Systemanforderungen Verlage & Akzidenzdruck

Technische Voraussetzungen

Intel 80x86 symmetrische Multiprozessorsysteme. Eine Präsentation im Rahmen des Seminars Parallele Rechnerarchitekturen von Bernhard Witte

GPGPU mit NVIDIA CUDA

Performance Testing Seminar zu Software-Tools für die Numerische Mathematik

Systemanforderungen ab Version 5.31

ESPRIT-Installationsanleitung Version 2014 R2

Oracle Database 10g RAC Plattformen im Detail

Die in diesem Dokument aufgelisteten Anforderungen an das Betriebssystem schließen die aktuellen Patches und Servivepacks ein.

Threads und OpenMP. Frank Mietke Cluster- & Gridcomputing Frank Mietke 7/4/04

Fragestellung: Wie viele CPU Kerne sollte eine VM unter Virtualbox zugewiesen bekommen?

Technische Voraussetzungen

Galaxy V7 in Deutsch ist ab sofort frei gegeben. Die Versionen Französisch, Italienisch und Englisch folgen spätestens Ende Oktober 2012.

Systeme I: Betriebssysteme Kapitel 4 Prozesse. Maren Bennewitz

VIRTUALISIERUNG IN MIKROKERN BASIERTEN SYSTEMEN

Intel VTune for Linux

Installationsanleitung für das Integrity Tool zur AusweisApp Version 1.7 (Microsoft Windows) Dokumentversion 1.0

Wine - Windows unter Linux

Hyper-V Grundlagen der Virtualisierung

Visualisierung paralleler bzw. verteilter Programme

Installation / Konfiguration

news 08 / 2015 Neue Version 2016

Außerdem werden folgende Symbole und Schreibweisen wiederholt dargestellt, um eine übersichtliche Gestaltung zu erreichen: Bemerkung

Systemanforderungen Verlage & Akzidenzdruck

Systemanforderungen. Sage Personalwirtschaft

Leistungs- und Geschwindigkeitssteigerung. Dipl.-Ing. Sebastian F. Kleinau Applikationsingenieur

EXPANDIT. ExpandIT Client Control Kurzanleitung. utilities. be prepared speed up go mobile. Stand

TREIBER INSTALLATIONSPROZESS WINDOWS 7 (32 oder 64 BIT)

SIMLUX: Virtualisierung. Simply Managed Linux

ESPRIT-Installationsanleitung Version 2013

CHARON-AXP Alpha Hardwarevirtualisierung

Octave für Windows. Leichte Variante (kein Cygwin installiert)

Malbuner mit DB2. Migrationsprojekt DB2 Volker Pinkitz, Leiter SAP CC

Inhaltsverzeichnis. BüroWARE Systemanforderungen ab Version Generelle Anforderungen SoftENGINE BüroWARE SQL / Pervasive. 2

PowerBridge MSSQL Beta

IT-Symposium C01 - Virtualisieren mit dem Windows Server 2008

Jetzt Upgraden und bis zu 60% sparen! - info@hocomputer.de - Tel: (+49) / 0221 /

Aktuelle Trends und Herausforderungen in der Finite-Elemente-Simulation

Parallele Programmierung mit OpenMP

Fachreferat. EFI -BIOS Nachfolger-

1 Einzelplatzversion. 1.1 Hardware. 1.2 Software* Stand Juli 2014

Code signing mit startssl

Dell Printer Management Pack Suite Version 5.0 für Microsoft System Center Operations Manager und Microsoft System Center Essentials

Installationsanleitung für das Touch Display: S170E1-01 LCD A170E1-T3 ChiMei - egalaxy

Rechen- und Kommunikationszentrum der RWTH Aachen. Systemkonfiguration der Laptops

Systemanforderungen. Sage Personalwirtschaft

Multicore Herausforderungen an das Software-Engineering. Prof. Dr.-Ing. Michael Uelschen Hochschule Osnabrück

Neues in Hyper-V Version 2

Anleitung: Installation von orgamax auf einem MAC

Universität Karlsruhe (TH)

White Paper. Embedded Treiberframework. Einführung

2. Funktionsprinzip der GAEB-Konverter Netzwerklizenz

Version 0.3. Installation von MinGW und Eclipse CDT

Anleitung: Installation von WISO Mein Büro auf einem Mac

IBM SPSS Modeler Text Analytics für Windows Installationsanweisungen

Computational Biology: Bioelektromagnetismus und Biomechanik

IT-Infrastruktur, WS 2014/15, Hans-Georg Eßer

Transkript:

Hochleistungsrechnen mit Windows Verifikations- und Analyseprogramme hristian Terboven Rechen- und Kommunikationszentrum RWTH Aachen 1 Hochleistungsrechnen mit Windows enter omputing and ommunication

Agenda Intel Threading Tools: Threadhecker AMD odeanalyst: Permanceanalyse Intel VTune: Permanceanalyse 2 Hochleistungsrechnen mit Windows enter omputing and ommunication

Agenda Intel Threading Tools: Threadhecker AMD odeanalyst: Permanceanalyse Intel VTune: Permanceanalyse 3 Hochleistungsrechnen mit Windows enter omputing and ommunication

Intel Threading Tools Data Race Ein Data Race ist ein typischer Fehler bei der Shared-Memory Programmierung, z.b. mit OpenMP. Tritt auf, wenn ein Thread einen Speicherbereich modifiziert die ein anderer Thread liest oder schreibt, in einer parallelen Region zwischen zwei Synchronisationspunkten. Unangenehm: das Auftreten ist nicht deterministisch, da z.b. die Reihenfolge der Ausführung von Iterationen in einer parallelen Schleife nicht festgelegt ist. Ursache sind in vielen Fällen fehlende private Klauseln, fehlende Barrieren oder fehlende kritische Regionen. Einfacher Test, der aber keine Korrektheit garantiert: der serielle ode muss das selbe Ergebnis liefern wie wenn der parallele ode rückwärts ausgeführt wird. Tool zur automatischen Verifikation: Intel Threadhecker für Windows (GUI) und Linux (Kommandozeile), früher Assure. 4 Hochleistungsrechnen mit Windows enter omputing and ommunication

Intel Threading Tools Threadhecker Arbeitsweise: in einem instrumentierten Programm werden die Speicherzugriffe protokolliert und es werden mögliche Data Races angezeigt Untersuchung auf serielle Äquivalenz. Threadhecker unterstützt: WIN32-Threads, Posix-Threads, OpenMP 2.5 Analyse unter Linux, Betrachtung der Ergebnisse unter Windows Analyse und Betrachtung der Ergebnisse unter Windows Achtung: die Analyse von Programmen, deren Ergebnisse von der Anzahl der Threads abhängt, ist nicht sinnvoll. 5 Hochleistungsrechnen mit Windows enter omputing and ommunication

Intel Threading Tools Threadhecker 16 h = 1.0 / (double) n; 17 sum = 0.0; 18 19 (i = 1; i <= n; i++) 20 { 21 x = h * ((double)i - 0.5); 22 sum += (4.0 / (1.0 + x*x)); 23 } 24 pi = h * sum; 1 4 Π = (1 + 6 Hochleistungsrechnen mit Windows enter 0 x 2 ) omputing and ommunication

Intel Threading Tools Threadhecker 16 h = 1.0 / (double) n; 17 sum = 0.0; 18 #pragma omp private(i,sum) shared(h) 19 (i = 1; i <= n; i++) 20 { 21 x = h * ((double)i - 0.5); 22 sum += (4.0 / (1.0 + x*x)); 23 } 24 pi = h * sum; Es gibt zwei Fehler in diesem Programm: Variable x muss privat sein. Variable sum muss reduziert werden. 7 Hochleistungsrechnen mit Windows enter omputing and ommunication

Intel Threading Tools Threadhecker Intel Threadhecker ist nur auf der Maschine WIN1 installiert, da er erweiterte Benutzerrechte benötigt. Version 3.0 beta ist installiert, das Release wird für Juni erwartet. Instrumentierung: Kompilation mit /Qopenmp und /Qtcheck Linken mit /fixed:no Starten mit Start All Programs Intel VTune Permance Analyzer. Neues Projekt erstellen vom Typ Threading Wizards Intel Threadhecker. 8 Hochleistungsrechnen mit Windows enter omputing and ommunication

Intel Threading Tools Intel Threadhecker Wir empfehlen die Analyse mit dem Threadhecker von jedem OpenMP-ode vor Produktionsbeginn. 9 Hochleistungsrechnen mit Windows enter omputing and ommunication

Agenda Intel Threading Tools: Threadhecker AMD odeanalyst: Permanceanalyse Intel VTune: Permanceanalyse 10 Hochleistungsrechnen mit Windows enter omputing and ommunication

AMD odeanalyst Permanceanalyse Die Permanceanalyse eines Programms besteht grob aus zwei Schritten: Finden des HotSpots in einem Programm. Analyse und Verbesserung der HotSpots. Ein HotSpot ist eine Stelle in einem Programm an der viel oder ein Großteil der Laufzeit verbracht wird. Die hierarchische Betrachtung des Programms spiegelt sich auch in der Benutzung von Permanceanalysetools wieder. 1. Stufe: Timer-based Profiling, um einen Eindruck von der Verteilung der Laufzeit in einem Programm zu bekommen. 2. Stufe: Detaillierte Analyse der HotSpots auf Probleme mit Hilfe z.b. von Hardware Permance ountern. Zur Analyse empfiehlt es sich, die Optimierung auf einen mittleren Wert zu setzen, aber möglichst alle Debuginmationen aufzunehmen. 11 Hochleistungsrechnen mit Windows enter omputing and ommunication

AMD odeanalyst Permanceanalyse Timer-based Profiling: Arbeit auf lokalen Platten ($TMP) um die Permance nicht zu beeinflussen. Start der Analyse durch Klicken auf 12 Hochleistungsrechnen mit Windows enter omputing and ommunication

AMD odeanalyse Permanceanalyse Das gesamte System wird analysiert: amdk8.sys: 72,6% PU Driver msvcr80d: 8,2% -Runtime ntoskrnl: 1,4% Kernelroutinen 13 Hochleistungsrechnen mit Windows enter omputing and ommunication

AMD odeanalyst Permanceanalyse Grafische Anzeige: Hier wird das Ergebnis aller Prozessorkerne zusammengefasst. Ebenfalls möglich: Anzeige pro Prozess. 14 Hochleistungsrechnen mit Windows enter omputing and ommunication

AMD odeanalyst Permanceanalyse Drill down in das Programm auf Funktionsebene: Quellcodeebene Auch die Anzeige von Samples für Assembler ist möglich. 15 Hochleistungsrechnen mit Windows enter omputing and ommunication

AMD odeanalyst Permanceanalyse Event-based Profiling: Es stehen alle Hardware Permance ounter der PU und des Systems zur Verfügung. 16 Hochleistungsrechnen mit Windows enter omputing and ommunication

AMD odeanalyst Permanceanalyse Die Anzeigemöglichkeiten sind identisch: 17 Hochleistungsrechnen mit Windows enter omputing and ommunication

Agenda Intel Threading Tools: Threadhecker AMD odeanalyst: Permanceanalyse Intel VTune: Permanceanalyse 18 Hochleistungsrechnen mit Windows enter omputing and ommunication

Intel VTune Permanceanalyse Problem: VTune läuft nur auf Intel Prozessoren, unser x86-luster besteht aber aus AMD Opteron Prozessoren. Die Maschine WIN1 ist eine Dual XEON 32bit Maschine. Es ist ein deutlich anderes Laufzeitverhalten als auf den Opterons beobachtbar. Die alte XEON-Architektur skaliert nicht bei gleichzeitigem Speicherzugriff, ist somit für die Analyse von parallelen Programmen nicht geeignet. Kaum Erfahrung mit Interna der XEONs, z.b. Hardware Permance ounter. In naher Zukunft sollte eine EM64T Maschine für VTune zur Verfügung stehen. 19 Hochleistungsrechnen mit Windows enter omputing and ommunication

Intel VTune Permanceanalyse 20 Hochleistungsrechnen mit Windows enter omputing and ommunication

Verifikations- und Analyseprogramme Gibt es Fragen zu diesem Teil? 21 Hochleistungsrechnen mit Windows enter omputing and ommunication