Proseminar Rechnerarchitekturen. Parallelcomputer: Multiprozessorsysteme

Ähnliche Dokumente

Mehrprozessorarchitekturen

Parallelrechner (1) Anwendungen: Simulation von komplexen physikalischen oder biochemischen Vorgängen Entwurfsunterstützung virtuelle Realität

Johann Wolfgang Goethe-Universität

Intel 80x86 symmetrische Multiprozessorsysteme. Eine Präsentation im Rahmen des Seminars Parallele Rechnerarchitekturen von Bernhard Witte

Kapitel 5. Parallelverarbeitung. Formen der Parallelität

Architektur paralleler Plattformen

2 Rechnerarchitekturen

Mehrprozessorarchitekturen (SMP, Cluster, UMA/NUMA)

Verteilte Betriebssysteme

Hardware-Architekturen

Parallelrechner: Klassifikation. Parallelrechner: Motivation. Parallelrechner: Literatur. Parallelrechner: PC-Technologie SMP-Multiprozessorsysteme 69

Systeme 1: Architektur

2.5. VERBINDUNGSNETZWERKE GESTALTUNGSKRITERIEN DER NETZWERKE TOPOLOGIE ALS GRAPH. Vorlesung 5 TOPOLOGIE: DEFINITIONEN : Sei G = (V, E) ein Graph mit:

Parallelverarbeitung. Parallelverarbeitung. 2. Grundlagen. 2. Grundlagen. 2.1 Parallelität

Kapitel 6 Anfragebearbeitung

Mikrocontroller Grundlagen. Markus Koch April 2011

Ein Verteiltes System ist eine Ansammlung von unabhängigen Rechnern, die für seine Benutzer wie ein einzelnes Computersystem aussieht.

Strukturelemente von Parallelrechnern

IT-Infrastruktur, WS 2014/15, Hans-Georg Eßer

Maik Zemann. Flynn s Taxonomie. Parallele Rechnerarchitekturen SS 2004 Technische Fakultät Universität Bielefeld. 3. Mai 2004 Flynn's Taxonomie 1

Die Marvel, ein gedrosselter Supercomputer

Architektur Verteilter Systeme Teil 2: Prozesse und Threads

Moderne Betriebssysteme. Kapitel 8. Kapitel 8. Folie: 1. Multiprozessorsysteme. Autor: Andrew S. Tanenbaum

Einführung in die technische Informatik

Computer-Architektur Ein Überblick

Die Linux Kernel Virtual Machine - Wo steht der Linux Hypervisor? 2. März 2008

OSL Storage Cluster und RSIO unter Linux Storage-Attachment und Hochverfügbarkeit in 5 Minuten

Parallel Computing. Einsatzmöglichkeiten und Grenzen. Prof. Dr. Nikolaus Wulff

Übersicht. Nebenläufige Programmierung. Praxis und Semantik. Einleitung. Sequentielle und nebenläufige Programmierung. Warum ist. interessant?

PVS Grobkonzept: Strukturelle und funktionale Erweiterungen bei der Verwaltung der Arbeitszeit und der organisatorischen Zuordnung

Bsys2 Zusammenfassung. Definition Die CPU ist das Gehirn des Computers. Sie holt Befehle aus dem Speicher und führt sie aus.

Nutzung von GiS BasePac 8 im Netzwerk

Protected User-Level DMA in SCI Shared Memory Umgebungen

Tutorium Rechnerorganisation

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Computer: PC. Informationstechnik für Luft-und Raumfahrt Aerospace Information Technology

Prof. Dr. Norbert Pohlmann, Institut für Internet Sicherheit - if(is), Fachhochschule Gelsenkirchen. Lage der IT-Sicherheit im Mittelstand

Kapitel VI. Speicherverwaltung. Speicherverwaltung

Vereinsverwaltung DFBnet Verein. Anleitung Familienbeiträge und Gemeinschaften

Advoware mit VPN Zugriff lokaler Server / PC auf externe Datenbank

Kapitel 1 Parallele Modelle Wie rechnet man parallel?

Rechnerarchitektur SS 2012

MS Outlook Integration

Systeme 1. Kapitel 6. Nebenläufigkeit und wechselseitiger Ausschluss

EXCHANGE Neuerungen und Praxis

Seminar Parallele Rechnerarchitekturen SS04 \ SIMD Implementierung aktueller Prozessoren 2 (Dominik Tamm) \ Inhalt. Seite 1

Lokales Netzwerk Probleme beim Verbinden eines Linux-Clients mit einem Windows 2003 Server Frage:

1 Aufgaben zu Wie funktioniert ein Computer?

HANDBUCH LSM GRUNDLAGEN LSM

Fremdwährungen in Buchungen erfassen

Schweizerische Kriminalprävention Prévention Suisse de la Criminalité

Staatlich geprüfter EDV-Führerschein

Technische Grundlagen von Netzwerken

Formular»Fragenkatalog BIM-Server«

Die Mikroprogrammebene eines Rechners

Cache-Kohärenz und -Konsistenz. Betreuer: Prof. Brüning Veton Kajtazi Mat.-Nr.: Universität Heidelberg

Persona-SVS e-sync GUI/Client Installation

Module Entwicklung. Um diese Eigenschaft aufzurufen, starten Sie die Adami Vista CRM Applikation und wählen Sie den Entwicklung Menü.

2. Braunschweiger Linux-Tage. Vortrag über RAID. von. Thomas King Braunschweiger Linux-Tage Seite 1/16

Endgeräteunabhängige Schlüsselmedien

Grundlagen der Videotechnik. Redundanz

WICHTIGER HINWEIS FÜR HÄNDLER UND SERVICE-WERKSTÄTTEN:

Prozesse und Logs Linux-Kurs der Unix-AG

Mindestanforderungen an Systemumgebung Für die Nutzung von excellenttango

Dokumentation. Black- und Whitelists. Absenderadressen auf eine Blacklist oder eine Whitelist setzen. Zugriff per Webbrowser

Vorlesung "Struktur von Mikrorechnern" (CBS)

Grundlagen der Programmierung 2. Parallele Verarbeitung

Flashfragen in ILIAS Test & Assessment. Helmut Schottmüller

Grundlagen der Parallelisierung

Anleitung zum Einstieg bei Cadenas

Rechner Architektur. Martin Gülck

Grundlagen verteilter Systeme

Speichernetze (Storage Area Networks, SANs)

Lizenzverwaltung Installation nachträglich erworbener Zusatzmodule

Session Beans & Servlet Integration. Ralf Gitzel ralf_gitzel@hotmail.de

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.

Analyse verschiedener HLS-Systeme in Hinblick auf ihren Umgang mit der Hochsprachenabstraktion Speicher. Sascha Kath

Professionelle Seminare im Bereich MS-Office

Anbindung des eibport an das Internet

Lehrer: Einschreibemethoden

CPU Speicher I/O. Abbildung 11.1: Kommunikation über Busse

Internet online Update (Mozilla Firefox)

Aufgabe 1: [Logische Modellierung]

Transkript:

<stefan@net-texde> wwwnet-texde Proseminar Rechnerarchitekturen Parallelcomputer: Multiprozessorsysteme Stefan Schumacher, <stefan@net-texde>, PGP Key <0xB3FBAE33> http://wwwnet-texde/uni Id: mps-folientex,v 1132 2003/11/14 21:14:34 stefan stable

<stefan@net-texde> Gliederung Gliederung Motivation Taxonomie Vektorrechner Feldrechner / systolisches Array Busbasierte Multiprozessorsysteme Schalterbasierte Multiprozessorsysteme Speicherarchitekturen & -verwaltung

<stefan@net-texde> Motivation Warum Multiprozessorsysteme? höhere Leistung bessere Skalierbarkeit besseres Preis/Leistungsverhältnis verteilte Nutzung von Daten und Ressourcen Sicherheit dank Redundanz einfachere Kommunikation

<stefan@net-texde> Motivation Nachteile Verbindungsnetzwerk ist Single Point of Failure Verbindungsnetzwerk meist Bottleneck

<stefan@net-texde> Taxonomie Hardwarekonzepte Kategorisierung nach Verbindung und Kommunikation Einteilung nach Flynn SISD : Single Input Single Data SIMD : Single Input Multiple Data MISD : Multiple Input Single Data MIMD : Multiple Input Multiple Data Stream

<stefan@net-texde> Taxonomie Flynn-Schema Parallelrechner SISD SIMD MISD MIMD von-neuman Vektorprozessor Arrayprozessor nicht existent Multiprozessor Multicomputer

<stefan@net-texde> Taxonomie Tanenbaum-Erweiterung erweitert Flynn-Schema bezgl verteilter Systeme eng gekoppelte Systeme lose gekoppelte Systeme weitere Unterteilung bezgl Kommunikation und Cache Busbasiert Schalterbasiert

<stefan@net-texde> Taxonomie Tanenbaum-Schema MIMD verteilte Systeme und Parallelrechner eng gekoppelt Multiprozessor lose gekoppelt Multicomputer UMA COMA NUMA Gitter Hypercube CoW CC-NUMA NC-NUMA

<stefan@net-texde> Vektorprozessoren Vektorprozessoren Parallelisierbarkeit von Vektoroperationen bestehen aus Skalareinheit und Vektoreinheit Parallelisierbarkeit tranparent in Hardware (Pipeline) Vorteil: gewohnt sequentiell programmierbar einige Compiler können parallelisieren

<stefan@net-texde> Vektorprozessoren Vektorrechner Instruktionspuffer Skalareinheit Vektoreinheit Instruktionsholer Hauptspeicher

<stefan@net-texde> Feldprozessoren Feldprozessoren einen Prozess auf verschiedene Mengen von gleichförmigen Daten anwenden einer Instruktionseinheit instruiert Befehl mehrere nebenläufige spezialisierte CPUs Abarbeitung des Befehls im Gleichtakt auf eigenes Datum

<stefan@net-texde> Feldprozessoren Feldprozessoren Programmspeicher Instruktionsholeeinheit Instruktionsausgabe Maskiereinheit Verarbeitungseinheit Verarbeitungseinheit Verarbeitungseinheit Verarbeitungseinheit Bussystem

<stefan@net-texde> Feldprozessoren Feldprozessorverarbeitungseinheit Skalarkontrolleinheit Maskiereinheit Skalarregister Skalarverarbeitungseinheit Speicher Buskontrolleinheit Instruktion Maske Datenpfad Instruktionspfad

<stefan@net-texde> Feldprozessoren systolisches Array besondere Form des Feldrechners zwei- oder dreidimensionale Verknüpfung von VE taktsynchrones Pipelineverfahren

<stefan@net-texde> Busbasierte Multiprozessorsysteme Busbasierte Multiprozessorsysteme n Prozessoren, 1 Speichermodul, verbunden über Bus Problem: Bus ist Flaschenhals, skaliert suboptimal Lösung: lokaler Cache speichert Blöcke zwischen

<stefan@net-texde> Busbasierte Multiprozessorsysteme Cache CPU 1 CPU 2 CPU 3 CPU n Cache 1 Cache 2 Cache 3 Cache n Speicher I/O

<stefan@net-texde> Busbasierte Multiprozessorsysteme Cache Problem: Cachekoheränz Datum in allen Speichern/Caches gleich Lösung 1: Write-Through-Cache Datum wird sofort in alle Speicher geschrieben Problem: Schreibperformance leidet Lösung 2: Snoopy Cache jeder Cache überwacht Bus auf Schreiboperation bei Treffer eigener gecacheter Daten wird aktualisiert

<stefan@net-texde> Busbasierte Multiprozessorsysteme Cache Lösung 3: Write-Back-Cache Datum wird nicht geändert, sondern als geändert gekennzeichnet Lösung 4: MESI Modified: Cache geändert,hauptspeicher ungültig Exclusive: Zeile liegt nur im Cache und ist unverändert Shared: Zeile liegt auch in anderen Caches Invalid: Zeile nicht im Cache verfügbar

<stefan@net-texde> Schalterbasierte Multiprozessorsysteme Schalterbasierte Multiprozessorsysteme Verschaltung von Speicher und CPUs, mehr als ein Bus Kreuzschienenverteiler (Crossbarswitch) Omeganetzwerk

<stefan@net-texde> Schalterbasierte Multiprozessorsysteme Kreuzschienenverteiler Kreuzschienenverteiler in 4x4 Matrix CP U : 0 CP U : 1 CP U : 2 CP U : n Speicher : 0 Speicher : 1 Speicher : 2 Speicher : n

<stefan@net-texde> Schalterbasierte Multiprozessorsysteme Omega Netzwerk Omeganetz mit 4 2x2-Schaltern CP U : n Speicher : n CP U : 2 Speicher : 2 CP U : 1 Speicher : 1 CP U : 0 Speicher : 0

<stefan@net-texde> Speicherarchitekturen und -verwaltung UMA UMA : Uniform Memory Architecture alle CPU mit Speicher verbunden siehe Einprozessorsysteme gleichförmiger Zugriff auf Speicher geringe Latenzzeit Beispiel: SMP

<stefan@net-texde> Speicherarchitekturen und -verwaltung NUMA NUMA : Non Uniform Memory Architecture nichtgleichförmiger Zugriff auf lokalen oder entfernten RAM Zugriff auf entfernten RAM möglich, aber langsam Beispiel: CM* Cluster aus CPU, MMU, I/O und RAM per Bus verbunden

<stefan@net-texde> Speicherarchitekturen und -verwaltung CM* Bus CPU RAM I/O MMU CPU RAM I/O MMU

<stefan@net-texde> Speicherarchitekturen und -verwaltung ccnuma ccnuma : cache coherent NUMA erweitern NUMA um koheränten Caches Snooping Caches, belasten Bus verzeichnisbasierte Multiprozessoren Datenbank über Cacheverteilung

<stefan@net-texde> Speicherarchitekturen und -verwaltung COMA COMA: Cache Only Memory Architecture RAM einer CPU als lokaler Cache physischer Adressraum Zeilen kann im gesamten System migrieren, benötigt spezielle Speicherverwaltung