Hardware-Architekturen



Ähnliche Dokumente
Proseminar Rechnerarchitekturen. Parallelcomputer: Multiprozessorsysteme

Ein kleiner Einblick in die Welt der Supercomputer. Christian Krohn

2.5. VERBINDUNGSNETZWERKE GESTALTUNGSKRITERIEN DER NETZWERKE TOPOLOGIE ALS GRAPH. Vorlesung 5 TOPOLOGIE: DEFINITIONEN : Sei G = (V, E) ein Graph mit:

Hochleistungsrechnen für Wissenschaft und Wirtschaft im internationalen Verbund

Johann Wolfgang Goethe-Universität

Mikrocontroller Grundlagen. Markus Koch April 2011

Software zur Anbindung Ihrer Maschinen über Wireless- (GPRS/EDGE) und Breitbandanbindungen (DSL, LAN)

4D Server v12 64-bit Version BETA VERSION

Arbeiten mit UMLed und Delphi

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

I. Allgemeine Zugangsdaten für den neuen Server: II. Umstellung Ihres Windows Arbeitsplatzrechners

Nutzung von GiS BasePac 8 im Netzwerk

IBM Software Demos Tivoli Provisioning Manager for OS Deployment

Anleitung über den Umgang mit Schildern

Was meinen die Leute eigentlich mit: Grexit?

Zwischenablage (Bilder, Texte,...)

Einführung in. Logische Schaltungen

Bilder zum Upload verkleinern

Downloadfehler in DEHSt-VPSMail. Workaround zum Umgang mit einem Downloadfehler

Rechnernetzwerke. Rechnernetze sind Verbünde von einzelnen Computern, die Daten auf elektronischem Weg miteinander austauschen können.

Leichte-Sprache-Bilder

schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG mitp/bhv

Lizenzierung von SharePoint Server 2013

Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten

Mindestanforderungen an Systemumgebung Für die Nutzung von excellenttango

Kapitel 5. Parallelverarbeitung. Formen der Parallelität

Installation LehrerConsole (für Version 6.2)

Wie können Sie eine Client Lizenz wieder freigeben?

Persona-SVS e-sync GUI/Client Installation

Lizenzierung von System Center 2012

BNC-, RJ45-, und Glasfaser- Netzwerkkarten

Lizenzierung von SharePoint Server 2013

Konzepte der Informatik

Bei der Installation folgen Sie den Anweisungen des Installations- Assistenten.

1. Übung - Einführung/Rechnerarchitektur

Wie Sie mit Mastern arbeiten

Internet online Update (Internet Explorer)

Das sogenannte Beamen ist auch in EEP möglich ohne das Zusatzprogramm Beamer. Zwar etwas umständlicher aber es funktioniert

Stundenerfassung Version 1.8 Anleitung Arbeiten mit Replikaten

Anleitung zur Nutzung des SharePort Utility

Anleitung. Datum: 28. Oktober 2013 Version: 1.2. Bildupload per FTP. FTP-Upload / Datei-Manager FTP. Glarotech GmbH

Auftrag zum Fondswechsel

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

Anleitung zur Erstellung einer Batchdatei. - für das automatisierte Verbinden mit Netzlaufwerken beim Systemstart -

Lineare Gleichungssysteme

Die Bundes-Zentrale für politische Bildung stellt sich vor

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Windows Server 2008 (R2): Anwendungsplattform

ecaros2 Installer procar informatik AG 1 Stand: FS 09/2012 Eschenweg Weiterstadt

1 Mathematische Grundlagen

Lehrer: Einschreibemethoden

Im Original veränderbare Word-Dateien

Wichtige Hinweise zu den neuen Orientierungshilfen der Architekten-/Objektplanerverträge

Anwendungshinweis Nr. 12. Wie konfiguriere ich redundante Serververbindungen

Computeria Urdorf. Treff vom 16. Januar Was ist ein Computer?

Einrichten einer Festplatte mit FDISK unter Windows 95/98/98SE/Me

Österreichische Trachtenjugend

Multimedia und Datenkommunikation

Systeme 1. Kapitel 6. Nebenläufigkeit und wechselseitiger Ausschluss

Übersicht. Nebenläufige Programmierung. Praxis und Semantik. Einleitung. Sequentielle und nebenläufige Programmierung. Warum ist. interessant?

ACDSee Pro 2. ACDSee Pro 2 Tutorials: Übertragung von Fotos (+ Datenbank) auf einen anderen Computer. Über Metadaten und die Datenbank

Wie erreiche ich was?

Anleitung zum Download der aktuellsten GreenStar Software für Original GreenStar System (Stand: August 2005)

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Produktionsplanung und steuerung (SS 2011)

Lizenzen auschecken. Was ist zu tun?

Zimmertypen. Zimmertypen anlegen

1) Farbsteuergerät in der Nikobus-Software unter Modul zufügen hinzufügen.

Informationsblatt Induktionsbeweis

Eine Anwendung mit InstantRails 1.7

Handbuch ECDL 2003 Modul 2: Computermanagement und Dateiverwaltung Der Task-Manager

FuxMedia Programm im Netzwerk einrichten am Beispiel von Windows 7

Grundfunktionen und Bedienung

Handbuch Fischertechnik-Einzelteiltabelle V3.7.3

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

I N F O R M A T I O N V I R T U A L I S I E R U N G. Wir schützen Ihre Unternehmenswerte

How-To-Do. Fernwartung einer VIPA Steuerung via Ethernet

Hyper-V Grundlagen der Virtualisierung

PowerWeiss Synchronisation

WLAN Konfiguration. Michael Bukreus Seite 1

Stepperfocuser 2.0 mit Bootloader

Mathematik: Mag. Schmid Wolfgang Arbeitsblatt 3 1. Semester ARBEITSBLATT 3 RECHNEN MIT GANZEN ZAHLEN

Manchester Codierung sowie Differenzielle Manchester Codierung

Primzahlen und RSA-Verschlüsselung

Netzwerkeinstellungen unter Mac OS X

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: )

Einrichtung des Cisco VPN Clients (IPSEC) in Windows7

Die Mikroprogrammebene eines Rechners

Videoüberwachung als Virtuelle Maschine. auf Ihrem Server, PC oder Mac. Peter Steinhilber

icloud nicht neu, aber doch irgendwie anders

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden.

Leitfaden zur ersten Nutzung der R FOM Portable-Version für Windows (Version 1.0)

Terminabgleich mit Mobiltelefonen

Internet online Update (Mozilla Firefox)

Print2CAD 2017, 8th Generation. Netzwerkversionen

Beispiel(unten ist der Spielfeldrand):

2. ERSTELLEN VON APPS MIT DEM ADT PLUGIN VON ECLIPSE

Serienbrieferstellung in Word mit Kunden-Datenimport aus Excel

Transkript:

Kapitel 3 Hardware-Architekturen Hardware-Architekturen Architekturkategorien Mehrprozessorsysteme Begriffsbildungen g Verbindungsnetze Cluster, Constellation, Grid Abgrenzungen Beispiele 1

Fragestellungen Wie sind parallele Rechnerstrukturen klassifiziert? Welche Konzepte der Speicheranbindung finden wir bei Mehrprozessorsystemen? Wie ausbaubar sind die Systeme? Welche Verbindungsarchitekturen gibt es? Wie grenzen sich Cluster von anderen Architekturen ab? Parallelverarbeitung Parallele Rechnerarchitekturen Besitzen Verarbeitungseinheiten, die koordiniert gleichzeitig an einer Aufgabe arbeiten Verarbeitungseinheiten Spezialisierte Einheiten wie z.b. Pipelines Gleichartige Rechenwerke Prozessoren Vollständige Rechner Parallelrechner und/oder Cluster 2

Klassifikation nach Flynn Klassifikation nach Flynn (1972) Rechner arbeiten mit Befehlsströmen und Datenströmen Aus ihrer Kombination ergeben sich 4 Varianten SISD single instruction, single data stream SIMD single instruction, multiple data stream MISD multiple instruction, single data stream MIMD multiple instruction, multiple data stream Klassifikation nach Flynn Was ist was bei Flynn? SISD: klassische von-neumann-architektur Monoprozessor-Rechner, Einprozessorrechner (z.b. PC) SIMD: Vektorrechner MISD: diese Klasse ist quasi leer, evtl. Schachcomputer MIMD: alles, was uns interessiert: die Mehrprozessorsysteme Wir müssen die Klasse der MIMD-Rechner weiter aufgliedern 3

Von-Neumann-Architektur ALU (Arithmetic Logic Unit) - Rechenwerk, auch Prozessor oder Zentraleinheit genannt, führt Rechenoperationen und logische Verknüpfungen durch. Control Unit - Steuerwerk oder Leitwerk, interpretiert die Anweisungen eines Programms und steuert die Befehlsabfolge. Memory - Speicherwerk speichert sowohl Programme als auch Daten, welche für das Rechenwerk zugänglich sind. I/O Unit - Eingabe-/Ausgabewerk steuert die Ein- und Ausgabe von Daten, zum Anwender (Tastatur, Bildschirm) oder zu anderen Systemen (Schnittstellen). Von-Neumann-Architektur 4

Vektorrechner Vektorprozessoren (auch Vektorrechner oder Array- Prozessoren genannt) führen eine Berechnung gleichzeitig auf vielen Daten (in einem Vektor bzw. Array) aus. Wenn viele gleichartige Daten auf gleiche Weise bearbeitet werden sollen (beispielsweise bei Matrizenoperationen), so sind Vektorprozessoren reinen Allzweck-Prozessoren (z. B. x86), die jedes Datum nacheinander bearbeiten, weit überlegen. Dies ist zumindest dann der Fall, wenn der Vektorrechner auch einen parallelen Zugriff auf den Hauptspeicher hat. Bsp.: Alle CRAY-Rechner, Earth-Simulator von NEC sehr ähnlich zu Grafikprozessoren Vektorrechner Y a X Y Beispiel: X und Y sind zwei Vektoren gleicher Länge (z.b. 64) und a ist eine skalare Größe. Dieses Problem wird auf Skalarprozessoren durch eine Schleife gelöst: for (i=0; i <= 63; i++) Y[i] = a * X[i] + Y[i]; Dieser Code entspricht 64 9 + 2 = 578 Instruktionen. 5

Vektorrechner Y a X Y Beispiel: X und Y sind zwei Vektoren gleicher Länge (z.b. 64) und a ist eine skalare Größe. Auf einem Vektorrechner würde das so gelöst werden: L.D F0, a ; Skalar a laden LV V1, Rx ; Vector X laden MULVS.D V2, V1, F0 ; Vector-Skalar Multiplikation LV V3, Ry ; Vector Y laden ADDV.D V4, V2, V3 ; Vektor Addition SV Ry, V4 ; Resultat speichern Dies sind nur 6 Instruktionen (unabhängig von der Größe der Vektoren!), da die Befehle MULVS.D und ADDV.D auf ganze Vektoren gleichzeitig angewendet werden. Statt Maschinensprache gibt es heutzutage auch Hochsprachen mit entsprechenden Compilern Vektorrechner Y a X Y Beispiel: X und Y sind zwei Vektoren gleicher Länge (z.b. 64) und a ist eine skalare Größe. Zur Verdeutlichung der Vektoroperation verwendet man häufig für die Aufgabe for (i=0; i <= 63; i++) Y[i] = a * X[i] + Y[i]; die Schreibweise (siehe MATLAB) Y[0:63] = a * X[0:63] + Y[0:63]; 6

Unterteilung von Flynn Unterteilung der Flynnschen Systeme Die Rechner bestehen aus mehreren Prozessoren, die über ein Verbindungsnetzwerk kommunizieren Über die Verbindungen erfolgt der Informationsaustausch zwischen Prozessen auf verschiedenen Prozessoren sowie Synchronisation und Kooperation Unterteilung von Flynn Unterscheidungskriterien Wie sehen die Prozessoren den Adressraum des Speichers? Wie sind die Speicherkomponenten mit dem Prozessor gekoppelt? Klassen Rechner mit verteiltem Speicher Rechner mit gemeinsamem Speicher Mischformen 7

Mehrprozessorsysteme mit verteiltem Speicher Prozesse sehen nur Adressraum im lokalen Speicher Weitere Daten durch Nachrichtenaustausch Beispiele: Einzelrechner/PC + Ethernetnetzwerk (TI-Labor) Rack-Einschub oder sogar nur Komponente eines Einschubs + hochspezielles Netzwerk via Backplane (SUN-Cluster) Mehrprozessorsysteme mit gemeinsamem Speicher Jeder Prozess sieht den gesamten Adressraum Datenaustausch durch Zugriff auf gemeinsame Datenbereiche ( shared memory ) Beispiele: Multicore-Prozessoren + Prozessor-Speicher-Bus HPC-Rechner + komplexeste Spezialhardware (Vorreiter war hier CRAY) 8

Mehrprozessorsysteme mit gemeinsamem Speicher und Cache In der Realität immer auch Cache-Speicher Sehr komplex mit der Konsistenz / Kohärenz Neue Frage des Scheduling der Prozesse Vor- und Nachteile der Ansätze Mehrprozessorsysteme mit verteiltem Speicher Hohe Ausbaubarkeit (100.000 und mehr Prozessoren) Komplexe Programmierung g Mehrprozessorsysteme mit gemeinsamem Speicher Geringe Ausbaubarkeit Einfachere Programmierung durch Compilerunterstützung 9

Weitere Bezeichnungen Verteilter Speicher Schwache Kopplung Lose Kopplung Multicomputersysteme Massiv parallele Systeme Gemeinsamer Speicher Enge Kopplung SMP (symmetric multiprocessing) Multi(-core)prozessoren Mehrprozessorsysteme mit verteiltem gemeinsamen Speicher Zwischenform Kommt im alltäglichen PC-Bereich nicht vor Logisch sieht jeder Prozess den gesamten Adressraum Physikalisch ist der Adressraum verteilt Bereitstellung durch Hardware und/oder Software (Virtualisierung, z.b. ScaleMP) Bezeichnung auch: DSM (distributed shared memory) 10

Skalierbarkeit Der Begriff Skalierbarkeit ist nirgends eindeutig definiert, aber der wohl am häufigsten benutzte Begriff beim Hochleistungsrechnen Gemeint ist: Ausbaubarkeit unter Beibehaltung gewisser positiver Charakteristika Z.B. Ein Programm skaliert gut, wenn es bei großer Prozeßzahl noch hohe Leistung bringt Ein Netzwerk skaliert gut, wenn beim Ausbau die Leistung mit dem investierten Geld korreliert Verbindungsnetze Im einfachsten Fall Gemeinsamer Speicher: Bussystem Verteilter Speicher: Sterntopologie mit Switch Im komplexen Fall Alle Varianten, jedoch keine Vollvermaschung Probleme Latenzzeiten, Übertragungszeiten Netzbelastung, Kollisionen 11

Betriebssysteme Cluster-Betriebssysteme UNIX-Derivate: praktisch alle Rechner MS-Windows: selten, aber jetzt auch (Windows HPC Server + Visual Studio 2010) Single System Image Das System erscheint dem Anwender wie ein System mit einem Knoten Lokalisierung von Diensten verborgen Nicht off-the-shelf h erhältlich h Spezialkonzept: Cluster Cluster of workstations (COW) Network of workstations (NOW) Beowulf cluster (1994 von Donald Becker und Thomas Sterling) Nur Standardkomponenten (commodity of the shelf components, COTS): PC-Prozessoren, Ethernet, Linux Der Arme-Leute-Parallelrechner 12

Spezialkonzept: Constellation Neuer Architekturtyp Cluster von SMP-Maschinen #Knoten < #Prozessorkerne/Knoten Warum das? Einfach zu produzieren und zu verkaufen (gut für die Hersteller) Probleme? Schwer zu programmieren (schlecht für Kunden) Beispiel Sun Constellation (damit wurde Ice Age 3 gerendert) z.b. beim DLR (768 Sun Blade 6220 Server mit insgesamt 6144 Prozessorkernen) Spezialkonzept: GRID Jederzeit verfügbare (hohe) Rechenleistung Vergleichbar zu Elektrizität heute Netzwerk von Hochleistungsrechnern Der Superrechner des reichen Mannes 13

Spezialkonzept: PRC PRC = Public Resource Computing unvorhersagbar verfügbare (hohe) Rechenleistung Netzwerk von Heimcomputern Muster: Client-Server Der Superrechner des armen Mannes dazu später mehr! Rechnerausstattung TI-Labor Sun Microsystems 8 Sun Fire X4200 Server Je 2 AMD Opteron 2-Kern-Prozessoren (2.2 GHz/ 1MB Cache) Gesamt: 32 Prozessorkerne 64 GByte RAM (je 4 bis 16 GByte pro Server) Neu: 16 Sun Fire X2200 Server Je 2 AMD Opteron 4-Kern-Prozessoren (2.7 GHz/6 MB L3) Gesamt: 128 Prozessorkerne 128 Gbyte RAM Backplane: Arista 7124S, 24-port-switch 10 GBit Ethernet Netzwerk 14

Rechnerausstattung TI-Labor Der leistungsfähigste Rechner der FH!!!! Hardware-Architekturen Zusammenfassung Eine erste wichtige Begriffsbildung wird von Flynn vorgenommen Wir unterscheiden Architekturen mit verteiltem und mit gemeinsamem Speicher Die Skalierbarkeit ist nur bei verteiltem Speicher sehr hoch, dafür erschwert sich die Programmierung Verbindungsnetzwerke gibt es in vielen verschiedenen Topologien Als Betriebssysteme meist UNIX-Derivate Neben Einzelrechnern kann man auch Mehrprozessor- Maschinen mit gemeinsamem Speicher und Großrechner zu Clustern zusammenfassen 15