Inhaltsverzeichnis. Visualisierung von Ausführungstraces. 1. Motivation. 2. Anwendungsfelder. 3. Visualisierungstools. 4.

Größe: px

Ab Seite anzeigen:

Download "Inhaltsverzeichnis. Visualisierung von Ausführungstraces. 1. Motivation. 2. Anwendungsfelder. 3. Visualisierungstools. 4."

Inge Holst
vor 5 Jahren
Abrufe

1 DIMO MALESHKOV Leiter: Dr.-Ing. Andreas Kerren Universität Kaiserslautern Inhaltsverzeichnis 1. Motivation 2. Anwendungsfelder 3. Visualisierungstools 4. Zusammenfassung 2/25

2 Inhaltsverzeichnis 1. Motivation 2. Anwendungsfelder 3. Visualisierungstools 4. Zusammenfassung 3/25 Motivation Die visuelle Informationsverarbeitung liegt in der Natur des Menschen Unsere Umgebung verarbeiten wir als kodierte Bilder - Wörter - Text /25

3 Motivation Alles ist Performance (wenn das Programm läuft...) Aber wie findet man das Performanceproblem? den Code nachprüfen, den Algorithmus verbessern die Ausführungstraces finden 5/25 Inhaltsverzeichnis 1. Motivation 2. Anwendungsfelder 3. Visualisierungstools 4. Zusammenfassung 6/25

4 Source-Code Probleme Source-Code Probleme sind hauptsächlich: Nicht optimal geschriebene Programme unnötige Wiederholung von aufwendigen Berechnungen Verschwendung von Speicher Nicht passender Algorithmus kommt sehr oft bei numerischen Applikationen vor 7/25 Sonstige Probleme Compiler-Probleme sind: der Compiler-generierte Code ist nie absolut optimal die passende Optimierungsstufe des Compilers ist schwierig einzustellen kleine Asslembler-Änderungen können eine große Performance- Verbesserung hervorrufen Parallele Programme (z.b. MPI) ein Bereich, in dem die Visualisierung notwendig ist 8/25

CPU Evolution(1) 9/25 Die physikalische Grenze ist erreicht. Weitere Frequenzerhöhung ist mit den heutigen Technologien nicht möglich. CPU Evolution(2) Die physikalische Grenze ist erreicht.

5 CPU Evolution(1) 9/25 Die physikalische Grenze ist erreicht. Weitere Frequenzerhöhung ist mit den heutigen Technologien nicht möglich. CPU Evolution(2) Die physikalische Grenze ist erreicht. Weitere Frequenzerhöhung ist mit den heutigen Technologien nicht möglich. neue Technologien sind nötig Z.B. Multiple Core, Cell Architekture, Hyperthreading,, L2 Cache- Verbesserungen hinsichtlich der Größe und der Geschwindigkeit usw. Die heutige Tendenz ist: Threading 10/25

Inhaltsverzeichnis 1. Motivation 2. Anwendungsfelder 3. Visualisierungstools 4. Zusammenfassung 11/25 Profiler Was muss visualisiert werden? Woher kommen die Daten?

6 Inhaltsverzeichnis 1. Motivation 2. Anwendungsfelder 3. Visualisierungstools 4. Zusammenfassung 11/25 Profiler Was muss visualisiert werden? Woher kommen die Daten? Profiler die g option gprof kprof Hardware Analyse? 12/25 % cumulative self self total time seconds seconds calls ms/call ms/call name open offtime memccpy write mcount tzset tolower strlen strchr main memcpy print profil report

7 Systemsimulator Welche Funktion hat ein Systemsimulator? Die ganze Systeminformation ist verfügbar Es gibt leider Genauigkeitsprobleme Bietet die besten Möglichkeiten zur Darstellung des Visualisierungsvehrfarens 13/25 TraceVis Interaktive Navigation die Cache-misses sind beobachtbar die Pipeline ist beobachtbar die Brunch Missprediction ist beobachtbar IPC Statistik 14/25

8 TraceVis: : Pipeline B-Brunch Miss prediction D-Cache Miss 15/25 Hell Rot - instruction fet Dunkel Rot - instruction decode Gelb - stalled instruction grün - ready to execute Helles Blau - executing Dunkel Balu - commit TraceVis: : Zoom Out 16/25 die Problemstellen sind leicht zu erkennen

9 TraceVis: : L2 Misses Links sieht man das L2 Cache Misses Histogramm 17/25 TraceVis: : L2 Misses Problemerklärung mit L2 Cache Misses 18/25

10 TraceVis: : Details Man kann immer einen Tracebereich auswählen, um zusätzliche Information zu bekommen 19/25 TraceVis: : Back to the Source 20/25

11 TraceVis: Search 21/25 VTune Intel Produkt Hardware counter einer der besten Code Analyser auf dem Markt Demo 22/25

12 Inhaltsverzeichnis 1. Motivation 2. Anwendungsfelder 3. Visualisierungstools 4. Zusammenfassung 23/25 The End Ausführungstraces Performance-Probleme Probleme Visualisierungsmethoden Tools (gprof( gprof, TraceVis, VTune) Literatur 24/25

13 Literatur [1] Toms Hardware [2] Kprof [3] TraceVis 25/25

Ähnliche Dokumente

Ferienakademie 2009. Programmierkonzepte für Multi-Core Rechner. Tools: Profiler

Ferienakademie 2009. Programmierkonzepte für Multi-Core Rechner. Tools: Profiler Ferienakademie 2009 Programmierkonzepte für Multi-Core Rechner Tools: Profiler Gliederung Einführung Aufgaben eines Profilers Techniken von Profilern Code Instrumentation Instruction Simulation Hardware