Was ist Rechnerleistung

Ähnliche Dokumente
Inhalt. Prozessoren. Curriculum Manfred Wilfling. 28. November HTBLA Kaindorf. M. Wilfling (HTBLA Kaindorf) CPUs 28. November / 9

Rechner Architektur. Martin Gülck

Technische Informatik - Eine Einführung

Grundlagen der Rechnerarchitektur

2.1 Rechnersichten 2.2 Rechnerorganisation: Aufbau und Funktionsweise

Die Mikroprogrammebene eines Rechners

L3. Datenmanipulation

Neue Prozessor-Architekturen für Desktop-PC


Grundlagen der Rechnerarchitektur. Einführung

Ein kleiner Einblick in die Welt der Supercomputer. Christian Krohn

Arbeitsfolien - Teil 4 CISC und RISC

Technische Grundlagen der Informatik 2 SS Einleitung. R. Hoffmann FG Rechnerarchitektur Technische Universität Darmstadt E-1

Architektur von Parallelrechnern 50

Kap 4. 4 Die Mikroprogrammebene eines Rechners

Fachbereich Medienproduktion

2 Rechnerarchitekturen

Mikroprozessoren Grundlagen AVR-Controller Input / Output (I/O) Interrupt Mathematische Operationen

Systeme 1: Architektur

Tutorium Rechnerorganisation

Rechneraufbau und Rechnerstrukturen

nutzt heute Diese Prinzipien werden wir im Kapitel 3 behandelt Lehrstuhl für Informatik 3 - D. Fey Vorlesung GRa - SS

Besprechung des 5. Übungsblattes Parallelität innerhalb der CPU Pipelining

Struktur der CPU (1) Die Adress- und Datenpfad der CPU: Befehl holen. Vorlesung Rechnerarchitektur und Rechnertechnik SS Memory Adress Register

ZENTRALEINHEITEN GRUPPE

Teil 1: Prozessorstrukturen

1 Konzepte der Parallelverarbeitung

Computer-Architektur Ein Überblick

Mikroprozessoren. Aufbau und Funktionsweise. Christian Richter. Ausgewählte Themen der Multimediakommunikation SS 2005

Architektur paralleler Plattformen

Instruktionssatz-Architektur

Das Prinzip an einem alltäglichen Beispiel

Einführung in die Systemprogrammierung

Johann Wolfgang Goethe-Universität

1 Proseminar: Konzepte von Betriebssystem-Komponenten. Thema: Server OS AS/400 Referend: Sand Rainer. Server OS - AS/400

3. Rechnerarchitektur

Rechnergrundlagen SS Vorlesung

Rechnergrundlagen SS Vorlesung

DIGITALE SCHALTUNGEN II

Verteilte Betriebssysteme

3 Technikarchitekturen

Neues vom STRIP Forth-Prozessor

1. Übung - Einführung/Rechnerarchitektur

Einleitung Performance Netzwerk Leistungsaufnahme Skalierbarkeit Sicherheit Zuverlässigkeit Kompatibilität. Ziele und Maße. Dr.-Ing.

Rechnerarchitektur WS 2003/2004. Klaus Waldschmidt. Teil 2. Begriffshierarchie der Rechnerarchitektur. Vorlesungsbegleitende Unterlagen

Embedded OS-9 auf RISC-Prozessoren von Motorola

Quiz. Gegeben sei ein 16KB Cache mit 32 Byte Blockgröße. Wie verteilen sich die Bits einer 32 Bit Adresse auf: Tag Index Byte Offset.

Geräteentwurf mit Mikroprozessoren 1

Vorlesung Rechnerarchitektur. Einführung

Systeme I: Betriebssysteme Kapitel 2 Überblick Betriebssysteme. Maren Bennewitz

4 Der Von-Neumann-Rechner als Grundkonzept für Rechnerstrukturen

Teil 1: Prozessorstrukturen

Rechnergrundlagen. Vom Rechenwerk zum Universalrechner

Grundlagen der Informatik für Ingenieure. 3. Grundlagen der Rechnerarchitektur

Systeme I: Betriebssysteme Kapitel 4 Prozesse. Wolfram Burgard

Pipelining. Die Pipelining Idee. Grundlagen der Rechnerarchitektur Prozessor 45

Name: Vorname: Matr.-Nr.: 4. a) RISC-Architekturen müssen zur Decodierung von Maschinenbefehlen stets ein mikroprogrammierbares Steuerwerk verwenden.

Übersicht. Ziele und Maße. Leistungsgrößen. Übersicht. Dr.-Ing. Volkmar Sieh WS 2008/2009. Leistungsgrößen wichtig für

Kap.2 Befehlsschnittstelle. Prozessoren, externe Sicht

Was ist die Performance Ratio?

Datenpfad einer einfachen MIPS CPU

RO II Übungen ohne Lösungen V20

Grundlagen der Rechnerarchitektur

Inhaltsangabe. 2.1 DieCPU Der Speicher Die Busse Klassifikation der von-neumann-rechner... 37

Compute Unified Device Architecture CUDA

Übersicht. Einleitung. Übersicht. Architektur. Dr.-Ing. Volkmar Sieh WS 2008/2009

Rechnernetze und Organisation

Vorstellung der SUN Rock-Architektur

Prinzipieller Aufbau und Funktionsweise eines Prozessors

Wichtige Rechnerarchitekturen

CPU Speicher I/O. Abbildung 11.1: Kommunikation über Busse

1 Maschinenunabhängige Optimierungen. Maschinenunabhängige Optimierungen Wintersemester 2008/09 1 / 17

Rechneraufbau und Rechnerstrukturen

1. Übersicht zu den Prozessorfamilien 2 2. Grundlagen der Rechnerorganisation 3

Datenpfad einer einfachen MIPS CPU

Computer-Generationen

Grundlagen der Informatik III Wintersemester 2010/2011

Mehrprozessorarchitekturen

11.0 Rechnerarchitekturen

Teil 1: Prozessorstrukturen

Die Architektur des Sun UltraSPARC T2 Prozessors, Anwendungsszenarien

Beispiele von Branch Delay Slot Schedules

Inhaltsverzeichnis 1. CHRONIK DER CPU ZENTRALEINHEIT PROZESSOR / CPU KERNGRÖSSEN... 5

Mikroprozessor bzw. CPU (Central Processing. - Steuerwerk (Control Unit) - Rechenwerk bzw. ALU (Arithmetic Logic Unit)

Architektur und Organisation von Rechnersystemen

Datenpfad einer einfachen MIPS CPU

Hyperthreads in Itanium - Prozessoren

Informatik 12 Kapitel 3 - Funktionsweise eines Rechners

Hardware-Architekturen

Computational Engineering I

Shangrila. One Instruction Set Computer

Multiprozessoren. Dr.-Ing. Volkmar Sieh. Institut für Informatik 3: Rechnerarchitektur Friedrich-Alexander-Universität Erlangen-Nürnberg SS 2011

Dämon-Prozesse ( deamon )

Systeme I: Betriebssysteme Kapitel 4 Prozesse. Maren Bennewitz

Philipp Grasl PROZESSOREN

RST-Labor WS06/07 GPGPU. General Purpose Computation On Graphics Processing Units. (Grafikkarten-Programmierung) Von: Marc Blunck

Rechneraufbau und Rechnerstrukturen

1 Einleitung zum RISC Prozessor

Memory Models. 17. September 2012

Proseminar Rechnerarchitekturen. Parallelcomputer: Multiprozessorsysteme

Transkript:

Was ist Rechnerleistung Leistung im engeren Sinne: Leistung gemessen in seltsamen Einheiten, bestimmt vorwiegend von der Zentraleinheit: MIPS (Millionen Instruktionen pro Sekunde) FLOPS (Floating Point Operations Per Second - Fließkommaoperationen pro Sekunde) SPECMARCS(Integer oder Float) LISP-Rate (Logical Inferences Per Second - Logische Schlußfolgerungen pro Sekunde) Leistung im weiteren Sinne: Leistung gemesssen im täglichen Einsatz, in Benchmark-Tests, bestimmt durch alle Komponenten des Systems: Durchsatz bei normalen Büroaufgaben; z.b. BABCo Suite, arbeitet mit 8 Programmen (WORD, Corel etc.) automatisch eine Reihe von Aufgaben ab. Antwortzeit (response time) - Reaktionszeit auf Eingaben im interaktiven Betrieb Speicherplatzbedarf Anzahl Nutzer gleichzeitig, z.b. Computererzeugte Testlast bis Leistungsgrenze des Systems erreicht ist. Spezialkomponenten DVS Weihenstephan / Nov. 98 Seite 3.1 -

Leistungssteigerung I Geschwindigkeit Der Prozessor arbeitet mit festem Takt, gesteuert von einem Taktgeber. Jeder Maschinenbefehl braucht eine feste Anzahl von Takten. Angabe in Hz; 1 MHz = 1 000 000 Hz Probleme: Temperatur Bauteilekosten, alle Komponenten müssen schnell sein (Waitstate) Packungsdichte Leitungslänge DVS Weihenstephan / Nov. 98 Seite 3.2 -

Leistungssteigerung II Vektorrechner - Fließbandprinzip mehrere Arbeitsschritte verzahnen (Vektorrechner, Fließbandprinzip) 1. Bereitstellen der Operanden 2. Subtraktion der Exponenten 3. Anpassen der Mantissen 4. Addition der Mantissen 5. Normalisieren 6. Abliefern des Ergebnis \ Takt: Operation \ 1 2 3 4 5 6 n n+1 n+2 n+3 n+4 n+5 ----------------+--------------------------------------------------- 1. Bereitstellen x1 x2 x3 x4 x5 x6 xn 2. Subtraktion x1 x2 x3 x4 x5 xn-1 xn 3. Anpassen x1 x2 x3 x4 xn-2 xn-1 xn 4. Addition x1 x2 x3 xn-3 xn-2 xn-1 xn 5. Normalisieren x1 x2 xn-4 xn-3 xn-2 xn-1 xn 6. Abliefern x1 xn-5 xn-4 xn-3 xn-2 xn-1 xn SPEEDUP kennzeichnet das Verhältnis von skalarer zu vektorieller Ausführung: Speedup = (n* p) n+ p -1 mit: n Vektorlänge p Pipelänge für n>>p gilt: Speedup --> p DVS Weihenstephan / Nov. 98 Seite 3.3 -

Leistungssteigerung III mehrere Arbeitsschritte parallel -- (VLIW-Rechner (Very Long Instruction Word-Rechner), Parallelrechner) Hohe Rechenleistung durch Verknüpfung mehrerer einfacher Prozessoren. Die Zerlegung der durchzuführenden Bearbeitungsschritte in Teilaufgaben nennt man Bereichsdekomposition Probleme: Kommunikation der Prozessoren Zugriff auf Speicher (Gültigkeit der Daten) Gemeinsamer Speicher: Viele Verbindungen nötig, gemeinsamer Zugriff möglich Bussystem zum Speicher: keine unnötigen Verbindungen, aber hohe Last am Bus Omega-Netze: Wenige Leitungen, aber Verlang-samung Parallelisierbarkeit der Programme resp. Probleme DVS Weihenstephan / Nov. 98 Seite 3.4 -

Leistungssteigerung IV Besser optimierte Maschinenbefehle (RISC) RISC = Reduced Instruction Set Computer Zentraleinheit kennt nur wenige einfache, aber hoch-opti-mierte Befehle CISC = Complex Instruction Set Computer Zentraleinheit kennt viele Spezialbefehle für viele komplexe Instruktionen, die Befehle sind aber nicht hochoptimiert DVS Weihenstephan / Nov. 98 Seite 3.5 -

Leistungssteigerung V Spezialprozessoren math. Koprozessor, Grafikprozessor, Videokompression, Plattenprozessoren Parallel arbeitende Funktionseinheiten teilfunktionale Prozessoren (Instruction Unit + Branch Processor + Fixed Point Unit + Floating Point Unit + Storage Control Unit + Data Cache Unit + I/O Unit Detailkonzepte im Prozessor Sprungzielvorhersage (branch prediction): Der Prozessor arbeitet schon mal auf Verdacht in einer möglichen Sprungrichtung weiter. Notfalls wird korrigiert, aber sehr oft liegt die Sprungzielvorhersage richtig und spart so Rechenzeit. Spekulative Ausführung (speculative execution), Prozessor arbeitet schon mal vor, auch wenn noch nicht feststeht, ob ein Verarbeitungsschritt tatsächlich gebraucht wird. Mehrprozessormaschinen Workstations, die mit 2 (4 oder 8) Prozessoren bestückt sind. Das Betriebssystem muß dies unterstützen und die Aufgaben (Tasks, besser Threads) verteilen können. z.b. symmetrisches Multiprocessing unter Windows NT DVS Weihenstephan / Nov. 98 Seite 3.6 -

Leistungssteigerung VI Vernetzte Systeme Dieser Ansatzpunkt zur Verbesserung der Systemleistung wird in Zukunft eine wichtige Rolle spielen. Zur Zeit werden entsprechende Netzprotokolle (Kommunikationsvereinbarungen) festgelegt, die unter dem Stichwort DCE = Distributed Computing Environment vereinfacht folgende Kernleistungen bieten: Nutzung entfernter Rechner innerhalb eines Programms für Teilrechnungen Nutzung netzweiter Dateisysteme Durchgängige Zugangskontrollen in einer Netzumgebung Verminderter Verwaltungsaufwand in heterogenen Netzumgebungen DVS Weihenstephan / Nov. 98 Seite 3.7 -