Vorlesung "Struktur von Mikrorechnern" (SMR)
|
|
- Falko Lorentz
- vor 6 Jahren
- Abrufe
Transkript
1 Prozessorhistorie: Pentium Der erste Pentium-Prozessor wurde 99 von Intel vorgestellt. Er besitzt: - 64 Bit breites Bus-Interface - zweigeteilter Primär-Cache mit je 8 KB für Code und Daten - Bezeichnung P5 für 5. Generation von Intelprozessoren Vektorisierungsansatz Kap.5 9 / 5 Prozessorhistorie: Pentium Leistungsentwicklung der Intel-CPU s bis zum Pentium I CPU CPU- Geschwindigkeit Takt- Multiplikator Systembus- Takt Datenbreite Speed- Index ,77 MHz 4,77 MHz 6 bit 8086 MHz MHz 6 bit DX 5 MHz 5 MHz bit DX-66 MHz bit 4 5x86- MHz 4 MHz bit 88 Pentium MHz,5 50 MHz 5 Pentium MHz,5 60 MHz 78 Pentium MHz,5 05 Pentium MHz 40 Pentium 66,5 57 Pentium MHz 69 Kap.5 0 / 5 Dr. R. Viga / EBS 008
2 Bezeichnung der internen Mikroarchitektur Prozessorhistorie: Pentium Überblick über die verschiedenen Pentium-Generationen (unvollst( unvollst.) P5 P6 P7 Intel führt inoffiziell Pentium (I), 99 Marktsegmentierung ein Pentium Pro, 995 Pentium II "Klamath", 997 Pentium II "Dechutes", 998 Celeron, 998 Pentium II Xeon, 998 Pentium III "Katmai", 999; "Copper Mine 999" "Tualatin", 00 Pentium III Xeon, 999 Itanium "Merced", 00 Pentium 4 "W illamette", 000; "Foster", 00; "Northwood", 00; "Flagstaff", 00 Pentium 4-M, 00 Itanium, 00 Xeon MP, 00 Pentium 4-E "Prescott", 004 Celeron D, 004 Pentium D "Smithfield", 005 Pentium 4 Extreme Edition "Gallatin", 005 Xeon DP, 006 Marktsegment Consumer Profi Server Mobile Kap.5 / 5 Prozessorhistorie: Mikroarchitekturen (ab Pentium) P5 (Bsp.: Pentium (I), 99) o -bit Prozessoren o Superskalare Architektur o 4GB Adressierbar o MMX-Behfehlssatz P6/Pentium-M (Bsp.: Pentium Pro, 955) o -bit Prozessoren o MMX-Befehlssatz o SSE-Befehlssatz, später SSE und SSE Net Burst/P7 (Bsp.: Pentium 4, 000) o -bit Prozessoren, später 64-bit Prozessoren o Power-Management-Unterstützung o SSE-Befehlssatz, später SSE und SSE4 o "Hyper-Threading"-Technologie (virtuelle CPUs) o Zwei Prozessorkerne (Pentium D / Extreme Edition) o "Speed-Step" Technologie (EIST) Kap.5 / 5 Dr. R. Viga / EBS 008
3 Prozessorhistorie: Mikroarchitekturen (ab Pentium) Core/P8 (Bsp.: Xeon "Woodcrest", 006) o 64-bit-Prozessoren o bis 4 Prozessorkerne o SSSE Befehlssatz o "Speed-Step" Technologie (EIST) Bonell/Atom (Bsp.: Atom "Silverthorne", 008) o "ultra low power" CPU o -bit Prozessor o "simultaneous multithreading"-technologie o SSE-Befehlssatz Nehalem (Bsp.: Core i "Clarkdale", 00) o 64-bit Prozessoren o bis 6 Prozessorkerne o "Hyper Threading"-Technologie Kap.5 / 5 Prozessorhistorie: Pentium In der Folge der Pentium-Entwicklungen wurden neben der steten Verbesserung der Leistungskenndaten (Taktrate, Cache-Größe, Registerzahl etc.) auch einige strukturelle und technologische Neuerungen eingeführt, wie: - z. T. -Typen (z.b. Pentium Pro), mit Möglichkeit zur Dekodierung von x86 CISC-Code - Integration des Second-Level-Cache in die CPU - Herabsetzung der Versorgungsspannung von 5V auf zunächst,v, dann,9v,,8v,,0v,,6v - Dynamic Scheduling: Branch Prediction, Scoreboard, Tomasulo - MMX-Befehle zur Beschleunigung der Graphik-Verarbeitung durch schnelle Blockoperationen (-Verarbeitung) - SSE-Befehle zur Beschleunigung der D-Graphik-Verarbeitung durch schnelle Floating-Point-Operationen (auch SSE, SSE, SSE4, SSSE) - Prozessor ID PSN (Prozessor Serial Number) mit 96 Bit - HT (hyper threading, abgeleitet von multithreading) zur parallelen Ausführung mehrerer Teilprogramme durch Generierung "virtueller CPU's" (Weiterentwicklung der Pipeline-Architektur) - Dual-Core/ Multi-Core Prozessoren mit mehreren Hauptprozessoren je IC - EIST-Technik (Enhanced Intel Speed Step Technology) ermöglicht dynamische Taktanpassung Kap.5 4 / 5 Dr. R. Viga / EBS 008
4 Grundsätzliches Mit normalen Pipelines (Überlappen von Instruktionen) ist nur eine maximale Performance von einem Befehl/Takt technisch und theoretisch möglich. Unterschreiten dieser Grenze ist nur mittels Parallelität auf Befehlsebene ( Level Parallelism) möglich. -Prozessor muss um Eigenschaften erweitert werden: - Prozessor muss mehrere Befehle gleichzeitig pro Takt laden können - Branches dürfen möglichst nicht zur Behinderung des Befehlsflusses führen (deshalb Sprungvorhersage) - häufig auftretende Datenabhängigkeiten müssen behandelbar sein - zur Auflösung echter Datenabhängigkeiten ist Out-Of-Order-Ausführung mit anschließender "Sortierung" notwendig Rechner mit dieser Implementierung werden als Superskalare-Rechner bezeichnet; Instruktionssequentialität (out of order execution) muss nicht eingehalten werden, wohl jedoch Ergebnissequentialität (in order commit). VLIW-Prozessoren (very large instruction word) nutzen Verschlüsselung mehrerer Befehle in einem OpCode. Moderne Prozessoren (ab Pentium IV) nutzen beide Techniken. Kap.5 5 / 5 Unterschied Superskalarität und VLIW-Prinzip a) Fetch Decode Execute Mem. Access Write Back Fetch Decode Execute Mem. Access Write Back -fach superskalare fünfstufige Pipeline b) Voraussetzung für Superskalarität ist Scheduling (Neusortierung der Ausführungsreihenfolge): -"statisch" durch den Compiler oder -"dynamisch" durch spezielle Prozessorhardware (unter Nutzung paralleler Buffer und Execution Units) Fetch Decode Execute Mem. Access Write Back Execute Execute VLIW-Prinzip mit drei Subbefehlen Kap.5 6 / 5 Dr. R. Viga / EBS 008 4
5 Scoreboard-Grundsätzliches IF Fetch IS Issue RO Read Operands EX EX EX EX WB Write Back Ziel des Scoreboards: Funktionseinheiten des Prozessors bestmöglich auslasten erteilen, herausgeben Scoreboard Scoreboard wählt aus einem Pool potentiell ausführbarer Befehle einen Satz von Befehlen aus. Scoreboard Register Register... Register n Funktionseinheit einheit einheit n Funktions-... Funktions- z. B. Branch z. B. - z. B. Processing Unit FP-Unit Unit Steuerlogik Tabelle Tabelle : Status der Funktionseinheiten Tabelle : Registerstatus Scoreboard ist informiert über - den aktuellen Bearbeitungszustand der Befehle (Phase des Befehlszyklus in dem sich die jeweiligen Befehle befinden), - den aktuellen Ausführungszustand aller Funktionseinheiten, - die Register, in welche die Funktionseinheiten ihre Ergebnisse schreiben. Daten werden nach jedem Ausführungsschritt aktualisiert. Kap.5 7 / 5 Scoreboard-Struktur Struktur Das Scoreboard hat drei Teile:. Befehlsstatus - Zeigt an, in welchem der vier Schritte sich der Befehl befindet.. Status der Funktionseinheiten - Zeigt den Zustand der Funktionseinheit (FE) an. Es gibt 9 Felder für jede FE: Busy - Zeigt an, ob die Einheit besetzt ist oder nicht Op - Die in der FE auszuführende Funktion (z.b. Addition oder Subtraktion) Fi Zielregister Fj,Fk - Quellregister-Adressen Qj,Qk - Nummer der FE, die die Register Fj, Fk erzeugt Rj,Rk - Flags zur Anzeige der Bereitschaft von Fj, Fk; die Felder werden zurückgesetzt, wenn neue Werte gelesen werden, so dass das Scoreboard weiß, dass die Quelloperanden gelesen wurden. (Das ist für die Behandlung von WAR-Hazards erforderlich.). Ergebnisregisterstatus - Zeigt an, welche FE ein Register schreiben will, wenn ein aktiver Befehl das Register als Ziel hat. write anterior to read Gefahr Kap.5 8 / 5 Dr. R. Viga / EBS 008 5
6 Scoreboard-Beispiel Befehlsstatus LD-Befehlsausführung beendet und Ergebnis geschrieben begrenzte Anzahl von Einträgen für behandelte Befehle, hier sechs Befehle begrenzte Anzahl von Einträgen für vorhandene Funktionseinheiten; hier fünf Einheiten Zahl der Einträge entspricht Registerzahl Befehl LD F6, 4(R) LD F, 45(R) MULT F0, F, F4 SUB F8, F6, F DIV F0, F0, F6 ADD F6, F8, F Name Mult Mult Add Divide Busy N Op Load Mult Sub Div Übergabe Status der Funktionseinheit Fi F F0 F8 F0 Fj R F F6 F0 F0 F F4 F6 Mult Operanden lesen Fk F4 F F6 F8 Sub Qj Mult Ergebnisregisterstatus Ausführung beendet Qk Ergebnis schreiben Rj N N Rk F0 F... F0 Divide N LD-Befehlsausführung beendet, aber Ergebnis nicht geschrieben MULT, SUB und DIV sind übergeben, aber warten auf Operanden ADD mit "Struktur- Hazard" (keine passende Funktionseinheit frei) bei Befehlsübergabe werden Operanden in Statustabelle eingetragen zeigt Quelleinheit für Ergebnis an Kap.5 9 / 5 Scoreboard-Datenkonflikte Scoreboard kann folgende Datenkonflikte nicht auflösen: - read anterior to write (RAW) Instr liest einen Operanden, den Instr noch nicht geschrieben hat - write anterior to read (WAR) Instr schreibt einen Operanden, bevor diesen die früher gestartete Operation Instr gelesen hat (kann in einfachen Pipelinestrukturen, in denen lesen vor schreiben stattfindet, nicht auftreten) - write anterior to write (WAW) Instr schreibt einen Operanden, der später von der früher gestarteten Operation Instr überschrieben wird Das Auftreten obiger Konflikte führt zu unerwünschten Wartezyklen. Abhilfe schaffen: - Out-of-order execution - Register-Renaming-Techniken (Schattenregister) Abwandlung des Scoreboards mit obigen Eigenschaften heißt Tomasulo- Methode (wird hier nicht behandelt). Kap.5 0 / 5 Dr. R. Viga / EBS 008 6
7 Grundsätzliches Allgemein sind verschiedenen Prozessortypen der jeweiligen Hersteller bestimmten Rechnerkategorien zugeordnet: - Intel, AMD Personal-Computer (viele Hersteller) - Motorola mit Prozessortypen 680XX und PowerPC MacIntosh-Computer (Hersteller Apple), ST-Computer (Atari) - IBM, Hewlett Packard (HP), Digital Equipment (DEC), Sun Microsystems etc. jeweils eigene Rechnertypen (die Rechnerklasse der Workstations); meist genutzt für rechenintensive Anwendungen im High-End-Bereich (z. B. D-CAD-Systeme) In den Prozessoren der diversen Hersteller werden die bereits von Intel- Prozessoren bekannten Techniken in unterschiedlicher Ausprägung eingesetzt. 5. Vergleich von Prozessorarchitekturen Kap.5 / 5 Blockstruktur des Alpha 064 Prozessors (DEC) Cache (8kB) Branch History Table Tag Floating-Point Pipeline (F Box) Control Unit (I Box) Pipeline (I Box) Multiplier/ Adder Divider Floating- Point Registers Prefetcher Resource Conflict Resolution Programm Counter Calculation/ Translation Buffer Pipeline Control Multiplier Adder Shifter Logic Box Registers Bus Interface Unit Cache Control (64/8) Adress translation and load/store (A box) Translation Adress Load Silo Buffer Generator Write Buffer () Cache (8kB) Tag 5. Vergleich von Prozessorarchitekturen Kap.5 / 5 Dr. R. Viga / EBS 008 7
8 Blockstruktur des PowerPC 60 (Motorola) Real-Time Clock Unit Queue + Issue Logic Unit + * / General Purpose Register File Branch Processing Unit Floating Point Unit + * / Floating Point Register File Memory Management Unit Physical -kb Unified Cache Memory Unit Snoop System Interface -bit Bus 64-bit Bus 5. Vergleich von Prozessorarchitekturen Kap.5 / 5 Leistungskenndaten unterschiedlicher Prozessoren im Überblick Microprocessor Company Alpha 064 Digital Equipment Corp. Introduction Date /9 Architecture and organization Type Width, bits (a) 64 On-chip cache kb 8/8 (instruction/data) Off-chip cache MB 6 (instruction/data) No. of registers / (general purpose/fp) issuse rate per cycle No. of independent units 4 No. of pipeline stages 7/0 (integer/fp) Endian (b) Little Typical latency /6 (integer/fp) Multiprocessing support? es MIPS R4400SC MIPS Technologies Inc. /9 64 6/6 4 / N.A. 7/0 Big/Little /4 es PA700 Hewlett Packard Co. /9 none / / 5/6 Big / es Pentium Intel Corp. /9 CISC 8/8 8/8 5/8 Little / es PowerPC 60 IBM Corp. and Motorola Inc. 4/9 unified / 4/6 Big/Little / es Super Sparc Sun Microsystems Corp. and Texas Instruments Inc. 5/9 0/6 6/ 5 4/5 Big / es Motorola Inc. 989 CISC 4/4 6/8 N.A. /6 Big / No Intel Corp. 6/9 CISC 8 unified 8/8 N.A. 5/N.S. Little N.S. No 5. Vergleich von Prozessorarchitekturen Kap.5 4 / 5 Dr. R. Viga / EBS 008 8
9 Klassifizierung der Queuetypen nach Verwendung Queues In-Line Branch Target Prefetch Load Store (Buffer) Decoded IBM 60/9 Intel 8086/86/486 Nondecoded IBM 700 Intel 8086 VAX-/780 PowerPC 60 Pentium Floating-Point Floating-Point IBM 60/9 PowerPC 60 IBM 60/9 PowerPC 60 Pentium Intel i Vergleich von Prozessorarchitekturen Kap.5 5 / 5 Dr. R. Viga / EBS 008 9
Vorlesung "Struktur von Mikrorechnern" (SMR)
Prozessorhistorie: Pentium Der erste Pentium-Prozessor wurde 99 von Intel vorgestellt. Er besitzt: - 64 Bit breites Bus-Interface - zweigeteilter Primär-Cache mit je 8 KB für Code und Daten - Bezeichnung
MehrNeue Prozessor-Architekturen für Desktop-PC
Neue Prozessor-Architekturen für Desktop-PC Bernd Däne Technische Universität Ilmenau Fakultät I/A - Institut TTI Postfach 100565, D-98684 Ilmenau Tel. 0-3677-69-1433 bdaene@theoinf.tu-ilmenau.de http://www.theoinf.tu-ilmenau.de/ra1/
MehrInstruktionen pro Takt
(c) Peter Sturm, Universität Trier (u.a.) 1 Instruktionen pro Takt 500 MIPS (Dhrystone) Taktfrequenz 450 400 350 300 250 200 150 100 50 0 8086 80286 80386 80486 Pentium Pentium Pro Die-Größen: Intel Vorlesung
MehrJR - RA - SS02 Kap
3.1 Elementare Datentypen, Operationen und ihre Realisierung (siehe 2.1) 3.2 Mikroprogrammierung 3.3 Einfache Implementierung von MIPS 3.4 Pipelining 3.5 Superskalare Befehlsausführung JR - RA - SS02 Kap.
MehrDynamisches Scheduling
12 Dynamisches Scheduling Peter Marwedel Informatik 12 TU Dortmund 2012/05/07 Diese Folien enthalten Graphiken mit Nutzungseinschränkungen. Das Kopieren der Graphiken ist im Allgemeinen nicht erlaubt.
MehrProzessorarchitektur. Dynamische Ablaufplanung. M. Schölzel
Prozessorarchitektur Dynamische Ablaufplanung M. Schölzel Inhalt HW-Architekturen zur Implementierung dynamischer Ablaufplanung: Scoreboard Tomasulo-Algorithmus Inhalt HW-Architekturen zur Implementierung
MehrRechnerarchitektur SS TU Dortmund
Rechnerarchitektur SS 2016 Exercises: Scoreboarding and Tomasulo s Algorithm Jian-Jia Chen TU Dortmund to be discussed on June, 14, 2016 Jian-Jia Chen (TU Dortmund) 1 / 8 Scoreboardings Im nächste Folien
MehrJR - RA - SS02 Kap
3.1 Elementare Datentypen, Operationen und ihre Realisierung (siehe 2.1) 3.2 Mikroprogrammierung 3.3 Einfache Implementierung von MIPS 3.4 Pipelining 3.5 Superskalare Befehlsausführung JR - RA - SS02 Kap.
MehrTeil 1: Prozessorstrukturen
Teil 1: Prozessorstrukturen Inhalt: Mikroprogrammierung Assemblerprogrammierung Motorola 6809: ein einfacher 8-Bit Mikroprozessor Mikrocontroller Koprozessoren CISC- und RISC-Prozessoren Intel Pentium
MehrArbeitsfolien - Teil 4 CISC und RISC
Vorlesung Informationstechnische Systeme zur Signal- und Wissensverarbeitung PD Dr.-Ing. Gerhard Staude Arbeitsfolien - Teil 4 CISC und RISC Institut für Informationstechnik Fakultät für Elektrotechnik
MehrBeispiele von Branch Delay Slot Schedules
Beispiele von Branch Delay Slot Schedules Bildquelle: David A. Patterson und John L. Hennessy, Computer Organization and Design, Fourth Edition, 2012 Grundlagen der Rechnerarchitektur Prozessor 97 Weniger
MehrTechnische Informatik 1 Übung 8 Instruktionsparallelität (Rechenübung) Andreas Tretter 8./9. Dezember Bitte immer eine Reihe freilassen
Technische Informatik 1 Übung 8 Instruktionsparallelität (Rechenübung) Andreas Tretter 8./9. Dezember 2016 Bitte immer eine Reihe freilassen Ziele der Übung Verschiedene Arten von Instruktionsparallelität
MehrRechnernetze und Organisation
RISC 1 Übersicht Motivation RISC-Merkmale RISC-Instruktionsformat Pipelining Sparc, MIPS, Arm, PowerPC 2 Motivation Warum RISC Compiler nutzen komplexe CISC-Instruktionen kaum Nur 80% der Instruktionen
MehrAn Introduction to Simultaneous Multi-Threading Prinziples and Architectures
An Introduction to Simultaneous Multi-Threading Prinziples and Architectures Seminarvortrag von Thomas Weber Lehrstuhl Rechnerarchitektur Übersicht? Motivation? Aktuelle Microarchitekturen? Scheduling?
Mehrfrüher: CISC ( Complex Instruction Set Computer )
Hochleistungs-CPUs früher: CISC ( Complex Instruction Set Computer ) mächtige Instruktionssätze zur Unterstützung von Hochsprachenkonstrukten durch Hardware (Idee: don t do in software what you can do
MehrAuch hier wieder. Control. RegDst Branch MemRead MemtoReg ALUOp MemWrite ALUSrc RegWrite. Instruction[31 26] (also: das Opcode Field der Instruktion)
Auch hier wieder Aus voriger Wahrheitstabelle lässt sich mechanisch eine kombinatorische Schaltung generieren, die wir im Folgenden mit dem Control Symbol abstrakt darstellen. Instruction[31 26] (also:
MehrWas ist die Performance Ratio?
Was ist die Performance Ratio? Wie eben gezeigt wäre für k Pipeline Stufen und eine große Zahl an ausgeführten Instruktionen die Performance Ratio gleich k, wenn jede Pipeline Stufe dieselbe Zeit beanspruchen
MehrPipelining. Die Pipelining Idee. Grundlagen der Rechnerarchitektur Prozessor 45
Pipelining Die Pipelining Idee Grundlagen der Rechnerarchitektur Prozessor 45 Single Cycle Performance Annahme die einzelnen Abschnitte des MIPS Instruktionszyklus benötigen folgende Ausführungszeiten:
MehrTechnische Informatik - Eine Einführung
Martin-Luther-Universität Halle-Wittenberg Fachbereich Mathematik und Informatik Lehrstuhl für Technische Informatik Prof. P. Molitor Technische Informatik - Eine Einführung Rechnerarchitektur Aufgabe
MehrName: Vorname: Matr.-Nr.: 4. a) RISC-Architekturen müssen zur Decodierung von Maschinenbefehlen stets ein mikroprogrammierbares Steuerwerk verwenden.
Name: Vorname: Matr.-Nr.: 4 Aufgabe 1 (8 Punkte) Entscheiden Sie, welche der folgenden Aussagen zum Thema CISC/RISC-Prinzipien korrekt sind. a) RISC-Architekturen müssen zur Decodierung von Maschinenbefehlen
MehrDatenpfad einer einfachen MIPS CPU
Datenpfad einer einfachen MIPS CPU Zugriff auf den Datenspeicher Grundlagen der Rechnerarchitektur Prozessor 19 Betrachten nun Load und Store Word Erinnerung, Instruktionen lw und sw sind vom I Typ Format:
MehrCPU. Dr.-Ing. Volkmar Sieh. Institut für Informatik 3: Rechnerarchitektur Friedrich-Alexander-Universität Erlangen-Nürnberg SS 2011
CPU Dr.-Ing. Volkmar Sieh Institut für Informatik 3: Rechnerarchitektur Friedrich-Alexander-Universität Erlangen-Nürnberg SS 2011 CPU 1/62 2012-02-29 CPU Übersicht: Pipeline-Aufbau Pipeline- Hazards CPU
MehrAllgemeine Lösung mittels Hazard Detection Unit
Allgemeine Lösung mittels Hazard Detection Unit Bildquelle: David A. Patterson und John L. Hennessy, Computer Organization and Design, Fourth Edition, 2012 Grundlagen der Rechnerarchitektur Prozessor 83
MehrDIGITALE SCHALTUNGEN II
DIGITALE SCHALTUNGEN II 3. Sequentielle Schaltkreise 3.1 Vergleich kombinatorische sequentielle Schaltkreise 3.2 Binäre Speicherelemente 3.2.1 RS Flipflop 3.2.2 Getaktetes RS Flipflop 3.2.3 D Flipflop
MehrTeil 1: Prozessorstrukturen
Teil 1: Prozessorstrukturen Inhalt: Mikroprogrammierung Assemblerprogrammierung Motorola 6809: ein einfacher 8-Bit Mikroprozessor Mikrocontroller Koprozessoren CISC- und RISC-Prozessoren Intel Pentium
MehrVorstellung der SUN Rock-Architektur
Fakultät Informatik Institut für Technische Informatik, Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur Vorstellung der SUN Rock-Architektur Hauptseminar Ronald Rist Dresden, 14.01.2009
MehrIntel P6 (Intel Pentium Pro) - Besonderheiten, Techniken und Architektur
Intel P6 (Intel Pentium Pro) - Besonderheiten, Techniken und Architektur P R O Z E S S O R - U N D R E C H N E R A R C H I T E K T U R P R Ä S E N T A T I O N 1 1. 0 7. 2 0 1 8 B E R N H A R D S A N G
MehrDatenpfad einer einfachen MIPS CPU
Datenpfad einer einfachen MIPS CPU Zugriff auf den Datenspeicher Grundlagen der Rechnerarchitektur Prozessor 19 Betrachten nun Load und Store Word Erinnerung, Instruktionen lw und sw sind vom I Typ Format:
MehrMikroprozessor als universeller digitaler Baustein
2. Mikroprozessor 2.1 Allgemeines Mikroprozessor als universeller digitaler Baustein Die zunehmende Integrationsdichte von elektronischen Schaltkreisen führt zwangsläufige zur Entwicklung eines universellen
MehrKap.2 Befehlsschnittstelle. Prozessoren, externe Sicht
Kap.2 Befehlsschnittstelle Prozessoren, externe Sicht 2 Befehlsschnittstelle 2.1 elementare Datentypen, Operationen 2.2 logische Speicherorganisation 2.3 Maschinenbefehlssatz 2.4 Klassifikation von Befehlssätzen
MehrRechnerarchitektur. Marián Vajteršic und Helmut A. Mayer
Rechnerarchitektur Marián Vajteršic und Helmut A. Mayer Fachbereich Computerwissenschaften Universität Salzburg marian@cosy.sbg.ac.at und helmut@cosy.sbg.ac.at Tel.: 8044-6344 und 8044-6315 30. Mai 2017
MehrCISC ( Complex Instruction Set Computer ) mächtige Instruktionssätze zur Unterstützung von Hochsprachenkonstrukten
Hochleistungs-CPUs CISC ( Complex Instruction Set Computer ) mächtige Instruktionssätze zur Unterstützung von Hochsprachenkonstrukten durch Hardware (Idee: don t do in software what you can do in hardware
MehrLehrveranstaltung: PR Rechnerorganisation Blatt 8. Thomas Aichholzer
Aufgabe 8.1 Ausnahmen (Exceptions) a. Erklären Sie den Begriff Exception. b. Welche Arten von Exceptions kennen Sie? Wie werden sie ausgelöst und welche Auswirkungen auf den ablaufenden Code ergeben sich
MehrDatenpfaderweiterung Der Single Cycle Datenpfad des MIPS Prozessors soll um die Instruktion min $t0, $t1, $t2 erweitert werden, welche den kleineren
Datenpfaderweiterung Der Single Cycle Datenpfad des MIPS Prozessors soll um die Instruktion min $t0, $t1, $t2 erweitert werden, welche den kleineren der beiden Registerwerte $t1 und $t2 in einem Zielregister
MehrRechnernetze und Organisation
Pentium 1 Übersicht Motivation Architektur Instruktions-Set Adressierungsarten Geschichte Verbesserung und Erweiterungen 2 Motivation Verständnis von Prozessoren: Warum Pentium statt kleiner CPU? Pentium
Mehrmoderne Prozessoren Jan Krüger jkrueger@techfak.uni-bielefeld.de
moderne Prozessoren Jan Krüger jkrueger@techfak.uni-bielefeld.de Übersicht FachChinesisch SPARC - UltraSparc III/IV PowerPC - PowerPC 970(G5) X86 - Pentium4(Xeon), Itanium, (Pentium M) X86 - AthlonXP/MP,
MehrCompiler für f r Eingebettete Systeme (CfES)
Compiler für f r Eingebettete Systeme (CfES) Sommersemester 2009 Dr. Heiko Falk Technische Universität Dortmund Lehrstuhl Informatik 12 Entwurfsautomatisierung für Eingebettete Systeme Kapitel 9 Ausblick
MehrRechnerarchitektur (RA)
2 Rechnerarchitektur (RA) Sommersemester 27 Pipelines Jian-Jia Chen Informatik 2 http://ls2-www.cs.tu.de/daes/ 27/5/3 Diese Folien enthalten Graphiken mit Nutzungseinschränkungen. Das Kopieren der Graphiken
MehrTeil 1: Prozessorstrukturen
Teil 1: Prozessorstrukturen Inhalt: Mikroprogrammierung Assemblerprogrammierung Motorola 6809: ein einfacher 8-Bit Mikroprozessor Mikrocontroller Koprozessoren CISC- und RISC-Prozessoren Intel Pentium
MehrTechnische Grundlagen der Informatik 2 SS Einleitung. R. Hoffmann FG Rechnerarchitektur Technische Universität Darmstadt E-1
E-1 Technische Grundlagen der Informatik 2 SS 2009 Einleitung R. Hoffmann FG Rechnerarchitektur Technische Universität Darmstadt Lernziel E-2 Verstehen lernen, wie ein Rechner auf der Mikroarchitektur-Ebene
MehrWas bringt der Merced?
Was bringt der Merced? Die Prozessorarchitektur IA-64 Bernd Däne TU Ilmenau, Fakultät I/A Tel.: 03677-69-1433 bdaene@theoinf.tu-ilmenau.de Gliederung 1. Merced - Itanium - IA-64 2. Die Vorgeschichte 3.
MehrÜbungen zu Grundlagen der Rechnerarchitektur und -organisation: Bonusaufgaben Übung 8 und Präsenzaufgaben Übung 9
Übungen zu Grundlagen der Rechnerarchitektur und -organisation: Bonusaufgaben Übung 8 und Präsenzaufgaben Übung 9 Dominik Schoenwetter Erlangen, 30. Juni 2014 Lehrstuhl für Informatik 3 (Rechnerarchitektur)
MehrTutorium Rechnerorganisation
Woche 8 Tutorien 3 und 4 zur Vorlesung Rechnerorganisation 1 Christian A. Mandery: KIT Universität des Landes Baden-Württemberg und nationales Grossforschungszentrum in der Helmholtz-Gemeinschaft www.kit.edu
MehrDatenpfad einer einfachen MIPS CPU
Datenpfad einer einfachen MIPS CPU Die Branch Instruktion beq Grundlagen der Rechnerarchitektur Prozessor 13 Betrachten nun Branch Instruktion beq Erinnerung, Branch Instruktionen beq ist vom I Typ Format:
MehrPipelining for DLX 560 Prozessor. Pipelining : implementation-technique. Pipelining makes CPUs fast. pipe stages
Pipelining for DLX 560 Prozessor Pipelining : implementation-technique Pipelining makes CPUs fast. pipe stages As many instructions as possible in one unit of time 1 Pipelining can - Reduce CPI - Reduce
MehrRechnerarchitektur (RA)
2 Rechnerarchitektur (RA) Sommersemester 26 Pipelines Jian-Jia Chen Informatik 2 http://ls2-www.cs.tu.de/daes/ 26/5/25 Diese Folien enthalten Graphiken mit Nutzungseinschränkungen. Das Kopieren der Graphiken
Mehrz/architektur von IBM
von IBM Grundzüge einer modernen Architektur Von Matthias Fäth Gliederung Geschichtlicher Überblick Neuestes Flaggschiff Namensgebung Überblick Warum 64-Bit große Register Kompatibilität zu älteren Systemen
MehrHochschule Düsseldorf University of Applied Sciences HSD RISC &CISC
HSD RISC &CISC CISC - Complex Instruction Set Computer - Annahme: größerer Befehlssatz und komplexere Befehlen höhere Leistungsfähigkeit - Möglichst wenige Zeilen verwendet, um Aufgaben auszuführen - Großer
MehrProzessor- und Rechnerarchitekturen (Master)
Prozessor- und Rechnerarchitekturen (Master) Themen am 28.06.17: Semesterrückblick, Terminplanung Ihrer Vorträge ProRecArc17_V10 Ulrich Schaarschmidt HS Düsseldorf, SS 2017 V1 (5.4.): Termine + mögliche
MehrKap.3 Mikroarchitektur. Prozessoren, interne Sicht
Kap.3 Mikroarchitektur Prozessoren, interne Sicht 1 3.1 Elementare Datentypen, Operationen und ihre Realisierung (siehe 2.1) 3.2 Mikroprogrammierung 3.3 Einfache Implementierung von MIPS 3.4 Pipelining
MehrProzessorarchitektur. Kapitel 1 - Wiederholung. M. Schölzel
Prozessorarchitektur Kapitel - Wiederholung M. Schölzel Wiederholung Kombinatorische Logik: Ausgaben hängen funktional von den Eingaben ab. x x 2 x 3 z z = f (x,,x n ) z 2 z m = f m (x,,x n ) Sequentielle
MehrRechnerorganisation. (10,11) Informationskodierung (12,13,14) TECHNISCHE UNIVERSITÄT ILMENAU. IHS, H.- D. Wuttke `09
Rechnerorganisation Mathematische Grundlagen (1) Boolesche Algebren: : BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten (6,7) Sequentielle Schaltungen (8) Programmierbare Strukturen (9) Rechneraufbau
MehrStruktur der CPU (1) Die Adress- und Datenpfad der CPU: Befehl holen. Vorlesung Rechnerarchitektur und Rechnertechnik SS Memory Adress Register
Struktur der CPU (1) Die Adress- und Datenpfad der CPU: Prog. Counter Memory Adress Register Befehl holen Incrementer Main store Instruction register Op-code Address Memory Buffer Register CU Clock Control
MehrUmstellung auf neue Pipeline
new_pipe Umstellung auf neue Pipeline»» Umstellung auf neue Pipeline Core mit 2 Port Registerfile In dieser Konfiguration wird am Registerfile ein Phasensplitting durchgeführt, um in jedem Takt 2 Register
MehrItanium 2. Götz Becker Lehrstuhl für Rechnerarchitektur
1 Itanium 2 Götz Becker Lehrstuhl für Rechnerarchitektur 2 Übersicht Einführung in die Itanium Architektur Besonderheiten der Architektur Beispiele für deren Anwendung Mikro-Architektur des Itanium 2 Compiler
MehrTeil 2: Rechnerorganisation
Teil 2: Rechnerorganisation Inhalt: Zahlendarstellungen Rechnerarithmetik schrittweiser Entwurf eines hypothetischen Prozessors mit Daten-, Adreß- und Kontrollpfad Speicherorganisation Mikroprogrammierung
MehrRO II Übungen ohne Lösungen V20
H. Richter 05.04.2017 RO II Übungen ohne Lösungen V20 Übung 1: Gesamtpunktzahl [76] (76P) 1 Aufgabe: Superskalarität [22] 1.) Worin besteht der Unterschied zwischen einem skalaren Prozessor und einem superskalaren
MehrRückseite vom Celeron Coppermine 128, 600 MHz
Intel Celeron (aus Wikipedia, der freien Enzyklopädie) Celeron ist heute Intels Markenname für eine abgespeckte Pentium-Variante der jeweils aktuellen Generation. Celerons sind vor allem für günstige Heim-
MehrSeminar Parallele Rechnerarchitekturen SS04 \ SIMD Implementierung aktueller Prozessoren 2 (Dominik Tamm) \ Inhalt. Seite 1
\ Inhalt Seite 1 \ Inhalt SIMD Kurze Rekapitulation 3Dnow! (AMD) AltiVec (PowerPC) Quellen Seite 2 \ Wir erinnern uns: Nach Flynn s Taxonomie kann man jeden Computer In eine von vier Kategorien einteilen:
MehrDigitaltechnik und Rechnerstrukturen. 2. Entwurf eines einfachen Prozessors
Digitaltechnik und Rechnerstrukturen 2. Entwurf eines einfachen Prozessors 1 Rechnerorganisation Prozessor Speicher Eingabe Steuereinheit Instruktionen Cachespeicher Datenpfad Daten Hauptspeicher Ausgabe
MehrGrundlagen der Informationsverarbeitung:
Grundlagen der Informationsverarbeitung: Parallelität auf Instruktionsebene Prof. Dr.-Ing. habil. Ulrike Lucke Durchgeführt von Prof. Dr. rer. nat. habil. Mario Schölzel Maximaler Raum für Titelbild (wenn
MehrARM: Befehlssatz (Forts.)
ARM: Befehlssatz (Forts.) Befehl SWI zum Auslösen eines Software-Interrupts: Instruktionsformat: Ausführung von SWI überführt CPU in den supervisor mode (nach Retten des PC in r14_svc und des CPSR in SPSR_svc)
MehrARM: Befehlssatz (Forts.)
ARM: Befehlssatz (Forts.) Befehl SWI zum Auslösen eines Software-Interrupts: Instruktionsformat: Ausführung von SWI überführt CPU in den supervisor mode (nach Retten des PC in r14_svc und des CPSR in SPSR_svc)
MehrMultiple Issue. Peter Marwedel Informatik /05/15. technische universität dortmund. fakultät für informatik informatik 12
2 Multiple Issue Peter Marwedel Informatik 2 22/5/5 Diese Folien enthalten Graphiken mit Nutzungseinschränkungen. Das Kopieren der Graphiken ist im Allgemeinen nicht erlaubt. Multiple Issue Techniken der
MehrComputer-Architektur Ein Überblick
Computer-Architektur Ein Überblick Johann Blieberger Institut für Rechnergestützte Automation Computer-Architektur Ein Überblick p.1/27 Computer-Aufbau: Motherboard Computer-Architektur Ein Überblick p.2/27
MehrMikroprozessoren. Aufbau und Funktionsweise. Christian Richter. Ausgewählte Themen der Multimediakommunikation SS 2005
Mikroprozessoren Aufbau und Funktionsweise Christian Richter Ausgewählte Themen der Multimediakommunikation SS 2005 Christian Richter (TU-Berlin) Mikroprozessoren AT MMK 2005 1 / 22 Gliederung Was ist
MehrCPU-Technik. Stand der Technik, Trends und Entwicklungen. Vortrag im Informatikseminar WS 2000/2001. (C) 2000 Heiko Panther
CPU-Technik Stand der Technik, Trends und Entwicklungen Vortrag im Informatikseminar WS 2000/2001 (C) 2000 Heiko Panther heikop@mac.com Inhalt 1. CISC und RISC 2. Vektorrecheneinheiten 3. VLIW 4. Weitere
MehrCell and Larrabee Microarchitecture
Cell and Larrabee Microarchitecture Benjamin Grund Dominik Wolfert Universität Erlangen-Nürnberg 1 Übersicht Einleitung Herkömmliche Prozessorarchitekturen Motivation für Entwicklung neuer Architekturen
MehrSprungvorhersagestrategien für Befehlspipelines
Fakultät Informatik, Institut für echnische Informatik, Professur VLSI-Entwurfssysteme, Diagnostik und Architektur Sprungvorhersagestrategien für Dresden, 09.07.2010 Was sind? Warum Sprungvorhersage? Folie
MehrParallele Rechnerarchitekturen. Bisher behandelte: Vorlesung 7 (theoretische Grundkonzepte) Nun konkrete Ausprägungen
Parallele Rechnerarchitekturen Bisher behandelte: Vorlesung 7 (theoretische Grundkonzepte) Nun konkrete Ausprägungen Pipelining Beispiel aus dem realen Leben (;-)) Wäschewaschen in WG Füllen der Waschmaschine
MehrUltraSPARC T2 Processor
UltraSPARC T2 Processor Vortrag im Rahmen des Seminars Ausgewählte Themen in Hardwareentwurf und Optik HWS07 Universität Mannheim Janusz Schinke Inhalt Überblick Core Crossbar L2 Cache Internes Netzwerk
MehrGeneration 5: Invisible Computers (ab 1993)
Generation 5: Invisible Computers (ab 1993) Jahr Name Gebaut von Kommentar 1993 PIC Microchip Technology Erster Mikrocontroller auf Basis von EEPROMs. Diese erlauben das Flashen ohne zusätzliche. Bemerkung:
MehrIm Bereich der Entwicklung und Herstellung von Prozessoren spielen
Prozessor (CPU) Allgemeines, Begriffe, Entwicklung Der Prozessor ist heutzutage das Herzstück fast eines jeden elektronischen Geräts. Er ist ein hochkomplexer Chip, der mit feinsten Halbleiterstrukturen
MehrRechnerorganisation. H.-D. Wuttke `
Rechnerorganisation Mathematische Grundlagen (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten (6,7) Sequentielle Schaltungen (8) Programmierbare Strukturen (9) Rechneraufbau
MehrGrundlagen der Rechnerarchitektur. MIPS Assembler
Grundlagen der Rechnerarchitektur MIPS Assembler Übersicht Arithmetik, Register und Speicherzugriff Darstellung von Instruktionen Logische Operationen Weitere Arithmetik Branches und Jumps Prozeduren 32
MehrProzessorarchitektur. Sprungvorhersage. M. Schölzel
Prozessorarchitektur Sprungvorhersage M. Schölzel Inhalt Sprungvorhersage statische Methoden dynamische Methoden Problem Fetch-Phase Befehlswarteschlange Speicher b? Neue Adresse für noch nicht bekannt
MehrInhalt. Prozessoren. Curriculum Manfred Wilfling. 28. November HTBLA Kaindorf. M. Wilfling (HTBLA Kaindorf) CPUs 28. November / 9
Inhalt Curriculum 1.4.2 Manfred Wilfling HTBLA Kaindorf 28. November 2011 M. Wilfling (HTBLA Kaindorf) CPUs 28. November 2011 1 / 9 Begriffe CPU Zentraleinheit (Central Processing Unit) bestehend aus Rechenwerk,
MehrRechnerarchitektur (RA)
12 Rechnerarchitektur (RA) Sommersemester 2016 Instruction Level Parallelism (ILP) Jian-Jia Chen Informatik 12 http://ls12-www.cs.tu-.de/daes/ 2016/05/31, 2016/06/01 Diese Folien enthalten Graphiken mit
MehrDynamische Fließbandverarbeitung und Konfliktlösung in superskalaren Prozessorarchitekturen
Dynamische Fließbandverarbeitung und Konfliktlösung in superskalaren Prozessorarchitekturen Projektarbeit im Wintersemester 2005/06 TU Darmstadt FG Rechnerarchitektur von Patrick Ediger ediger@rbg.informatik.tu-darmstadt.de
MehrRISC - Architekturen. Design Digitaler Systeme. Prof. Dr.-Ing. Rainer Bermbach
RISC - Architekturen Design Digitaler Systeme Prof. Dr.-Ing. Rainer Bermbach Übersicht CISC - RISC Hintergrund Merkmale von RISC-Architekturen Beispielarchitektur SPARC Zusammenfassung 2 1 CISC - RISC
MehrGrundlagen der Rechnerarchitektur
Grundlagen der Rechnerarchitektur Prozessor Übersicht Datenpfad Control Pipelining Data Hazards Control Hazards Multiple Issue Grundlagen der Rechnerarchitektur Prozessor 2 Datenpfad einer einfachen MIPS
MehrDies gibt nur eine grobe Übersicht über die verschiedenen älteren CPUs.
Dies gibt nur eine grobe Übersicht über die verschiedenen älteren CPUs. Herbei will ich nicht zu tief in Details gehen, da das die meisten Einsteiger verwirrt und zu viele technische Details beinhalten
MehrVorlesung Rechnerarchitektur. Einführung
Vorlesung Rechnerarchitektur Einführung Themen der Vorlesung Die Vorlesung entwickelt an Hand von zwei Beispielen wichtige Prinzipien der Prozessorarchitektur und der Speicherarchitektur: MU0 Arm Speicher
MehrRechnerarchitektur WS 2003/2004. Klaus Waldschmidt. Teil 11. Hardwaresystemarchitekturen - Superskalarität
Rechnerarchitektur Vorlesungsbegleitende Unterlagen WS 2003/2004 Klaus Waldschmidt Teil 11 Hardwaresystemarchitekturen - Superskalarität Seite 1 Hardwaresystemarchitekturen HSA moderner Mikroprozessoren
MehrN Bit Binärzahlen. Stelle: Binär-Digit:
N Bit Binärzahlen N Bit Binärzahlen, Beispiel 16 Bit: Stelle: 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 Binär-Digit: 0 0 1 0 1 0 0 1 1 1 0 0 1 0 0 0 Least Significant Bit (LSB) und Most Significant Bit (MSB)
MehrTechnische Informatik 1 - HS 2016
Institut für Technische Informatik und Kommunikationsnetze Prof. L. Thiele Technische Informatik 1 - HS 2016 Lösungsvorschläge für Übung 8 Datum: 8. 9. 12. 2016 1 Instruktionsparallelität VLIW Gegeben
MehrMikroController und Mikroprozessoren
Uwe Brinkschulte Theo Ungerer MikroController und Mikroprozessoren Mit 205 Abbildungen und 39 Tabellen Springer Inhaltsverzeichnis 1 Grundlagen 1 1.1 Mikroprozessoren, MikroController, Signalprozessoren
MehrBenchmarking Intel Pentium III-S vs. Intel Pentium 4
Benchmarking Intel Pentium III-S vs. Intel Pentium 4 André Ceselski Raphael Rosendahl 30.01.2007 Gliederung Motivation Vorstellung der Architekturen Intel P6 Architektur Intel NetBurst TM Architektur Architektur-Unterschiede
MehrTechnische Informatik 1 - HS 2017
Institut für Technische Informatik und Kommunikationsnetze Prof. L. Thiele Technische Informatik 1 - HS 2017 Übung 8 Datum: 30. 11. 1. 12. 2017 In dieser Übung soll mit Hilfe des Simulators WinMIPS64 die
MehrRechner Architektur. Martin Gülck
Rechner Architektur Martin Gülck Grundlage Jeder Rechner wird aus einzelnen Komponenten zusammengesetzt Sie werden auf dem Mainboard zusammengefügt (dt.: Hauptplatine) Mainboard wird auch als Motherboard
MehrDie Intel Atom Architektur
Fakultät Informatik, Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur Die Intel Atom Architektur Hauptseminar Technische Informatik dennis.walter@mailbox.tu-dresden.de Dresden, 18.06.2008
MehrVon-Neumann-Architektur
Von-Neumann-Architektur Bisher wichtig: Konstruktionsprinzip des Rechenwerkes und Leitwerkes. Neu: Größerer Arbeitsspeicher Ein- und Ausgabewerk (Peripherie) Rechenwerk (ALU) Steuerwerk (CU) Speicher...ppppp...dddddd..
MehrOptimierungen der Lattice Boltzmann Methode auf x86-64 basierten Architekturen
Optimierungen der Lattice Boltzmann Methode auf x86-64 basierten Architekturen J. Treibig, S. Hausmann, U. Ruede 15.09.05 / ASIM 2005 - Erlangen Gliederung 1 Einleitung Motivation Grundlagen 2 Optimierungen
MehrDigitaltechnik und Rechnerstrukturen Lothar Thiele Institut für Technische Informatik und Kommunikationsnetze ETH Zürich 1.
Materialien Digitaltechnik und Rechnerstrukturen Lothar Thiele Institut für Technische Informatik und Kommunikationsnetze ETH Zürich 1. Einleitung 1 Digitaltechnik und Rechnerstrukturen Vorlesungs- und
Mehr