Die Intel Atom Architektur

Ähnliche Dokumente
Die Sandy-Bridge Architektur

ASIC-SYNTHESE DER SHAP-MIKROARCHITEKTUR

Instruktionen pro Takt

UltraSPARC T2 Processor

Benchmarking Intel Pentium III-S vs. Intel Pentium 4

Untersuchung und Vorstellung moderner Grafikchiparchitekturen

Multi-Port-Speichermanager für die Java-Plattform SHAP

Technische Grundlagen der Informatik 2 SS Einleitung. R. Hoffmann FG Rechnerarchitektur Technische Universität Darmstadt E-1

Prozessor- und Rechnerarchitekturen (Master)

Neue Prozessor-Architekturen für Desktop-PC

DIE EVOLUTION DES DRAM

Pipelining. Die Pipelining Idee. Grundlagen der Rechnerarchitektur Prozessor 45

JAEMACOM Berlin. Benjamin Schantze IGEL Technology GmbH

Extrablatt IT. MADE IN GERMANY.

Was ist die Performance Ratio?

Datenpfad einer einfachen MIPS CPU

Neue Dual-CPU Server mit Intel Xeon Scalable Performance (Codename Purley/Skylake-SP)

Datenpfad einer einfachen MIPS CPU

Rechner Architektur. Martin Gülck

Der Aufbau der Fusion-APU von AMD

moderne Prozessoren Jan Krüger

Tastatur. Software. Prozessor Besonderheiten. Eingabegerät Touchpad Numerisches Keypad Full-size Tastatur Island-Stil Tastatur

Processors for mobile devices

Komplettsysteme. Hersteller Art. Nr EAN/UPC

Auch hier wieder. Control. RegDst Branch MemRead MemtoReg ALUOp MemWrite ALUSrc RegWrite. Instruction[31 26] (also: das Opcode Field der Instruktion)

Energiesparmechanismen des

Rückseite vom Celeron Coppermine 128, 600 MHz

Computer-Architektur Ein Überblick

Hyperthreads in Itanium - Prozessoren

Verlustleistungsreduzierung in Datenpfaden

Computergrundlagen Geschichte des Computers

Raytracing auf Desktop PCs Optimizing Cache Usage (Intel Corp.)

ASUS ZENBOOK UX330UA - 13,3" Notebook - Core i7 Mobile 2,5 GHz 33,8 cm

Computergrundlagen Geschichte des Computers

Technische Informatik 1

Seminar Multicore-Programmierung

Technische Informatik 1 Übung 8 Instruktionsparallelität (Rechenübung) Andreas Tretter 8./9. Dezember Bitte immer eine Reihe freilassen

Siemons EDV-Service GbR. Heike Siemon

Beispiele von Branch Delay Slot Schedules

Frank Kuchta Markus Rüger

Name: Vorname: Matr.-Nr.: 4. a) RISC-Architekturen müssen zur Decodierung von Maschinenbefehlen stets ein mikroprogrammierbares Steuerwerk verwenden.

Seminar Parallele Rechnerarchitekturen SS04 \ SIMD Implementierung aktueller Prozessoren 2 (Dominik Tamm) \ Inhalt. Seite 1

Struktur der CPU (1) Die Adress- und Datenpfad der CPU: Befehl holen. Vorlesung Rechnerarchitektur und Rechnertechnik SS Memory Adress Register

Codesigned Virtual Machines

Hyrican GIGABYTE Edition CTS MT- 1 x Pentium G4500 / 3.5 GHz - RAM 8 GB

RO-Tutorien 3 / 6 / 12

Bedienerhandbuch. picoserver - Atom. ies GmbH & Co. KG.

TecNews: Sandy Bridge

HP Enterprise ProLiant DL360 G7 Performance

HP Workstation z640 - Workstation - Xeon E5 2,4 GHz - RAM: MB DDR-4 - HDD: 256 GB Serial ATA - Nicht verfügbar

Vorlesung "Struktur von Mikrorechnern" (SMR)

Das Prinzip an einem alltäglichen Beispiel

Zusammenfassung zur Vorlesung CMOS- Analogschaltungen für Transceiver- Anwendungen. Roland Pfeiffer 18. Vorlesung

Intel Core i5 3570K GHz

Übersicht aktueller heterogener FPGA-SOCs

Arbeitsfolien - Teil 4 CISC und RISC

Fachbereich Medienproduktion

LEISTUNGSVERGLEICH VON FPGA, GPU UND CPU FÜR ALGORITHMEN ZUR BILDBEARBEITUNG PROSEMINAR INF-B-610

Produkte und Preise TERRA PC

Virtualisierung: Neues aus 2010 und Trends 2011

ARM Cortex-M Prozessoren. Referat von Peter Voser Embedded Development GmbH

Vom Web ins IoT: Schnelleinstieg in Tooling und Entwicklung

Software ubiquitärer Systeme

Vortrag zum Proseminar Architekturen der ARM CORTEX Familie

Technische Informatik - Eine Einführung

Übersicht über Technologie und Nutzung von Solid State Drives

Multicore-Architekturen

PRODUKTE UND PREISE TERRA MOBILE.

WORTMANN AG IT - Made in Germany

PRODUKTE UND PREISE TERRA MOBILE.

Auch unterwegs bestens gerüstet mit den FUJITSU LIFEBOOKs

Mikroprozessoren. Aufbau und Funktionsweise. Christian Richter. Ausgewählte Themen der Multimediakommunikation SS 2005

Transkript:

Fakultät Informatik, Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur Die Intel Atom Architektur Hauptseminar Technische Informatik dennis.walter@mailbox.tu-dresden.de Dresden, 18.06.2008

Überblick 1. Einführung 2. Design und Architektur 3. Low Power Design am Beispiel des SRAMs 4. Performance/Ausblick 5. Zusammenfassung Folie 2 von 18

Einführung x86 everywhere? Brauchen wir einen weiteren x86-prozessor? Server/HPC Desktop Notebook Low-Cost Plattformen? Mobile Internet Devices (MIDs) / Nettops? Smartphones? Handys? Folie 3 von 18

Produkte Folie 4 von 18

Intel Atom Menlow-Plattform = CPU + Chipsatz Prozessor (Silverthorne/Diamondville) + 945G & ICH7 oder US15W (Poulsbo) Folie 5 von 18

Silverthorne IA-32 & Intel 64 45nm Technologie (high-k, 9 metal layer) 24mm² Die Größe, 3.1mm*7.8mm Single Core, 47 Millionen Transistoren Hyperthreading (2 Threads/Core) 0.8GHz - 1.86GHz 0.6W 2.64W TDP, Average Power < 200mW L1-Cache: 32kB Instruction / 24kB Data L2-Cache: 512kB, 8-fach assoziativ, 256 Bit Anbindung Virtualisierung (Intel VT) Execution Disable Bit SSE2, SSE3 100MHz/133MHz FSB (GTL & CMOS) Sleep States: C0/C1/C2/C4/C6 Dynamic Cache Sizing Folie 6 von 18

Silverthorne Design FUSES ADDRESS BIU FPC PLLs 512 kb L2-CACHE MEC IEC FEC DATA 205 Functional-Unit-Blocks (FUB) 46% synthetisierte random logic blocks 45% cell-based mit structured data path design 9% full-custom Folie 7 von 18

Silverthorne - Design Anzahl Transistoren: Core 13.828.574 Uncore 2.738.951 L2 & L2-Tag 30.644.682 47.212.207 Sea-of-FUBs starke Modularisierung, keine Hierarchie FUBs können unabhängig voneinander entworfen werden jeder FUB bekommt Area & Power Budget Erhöhung der Wiederverwendbarkeit durch FUB-Design und häufiger Verwendung von Standardzellen Taktverteilung über eine Baumstruktur, nur 10% der Gesamtverlustleistung für Verteilung des Taktes Folie 8 von 18

Architektur - Entwicklung 1999: Idee die P6-Architektur (Pentium Pro, PII, PIII) für ein Low-Power Design abzuwandeln 2002: neue Mikroarchitektur Snocone, Simulationen ergeben Leistungsaufnahme im Bereich ein Watt möglich 2004: Design für x86-low-power-core startet mögliche Einsatzgebiete: Many-Core CPUs oder Standalone Grundlegende Designregel: jedes Feature darf pro Prozentpunkt Performancezuwachs maximal ein Prozent mehr Verlustleistung verursachen Folie 9 von 18

Silverthorne - Pipeline 1 2 3 4 5 6 7 8 9 IF1 IF2 IF3 ID1 ID2 ID3 SC IS IRF Instruction Fetch Instruction Decode Instruction Dispatch Src. Op. Read 16 Pipeline Stufen In-Order Issue, 2 µops pro Takt 2-faches Simultaneous Multithreading (Hyperthreading) Instruction Scheduling Queues (jeweils 16 Einträge pro Thread) bei Abarbeitung eines Programmes werden durchschnittlich 96% aller Instruktionen in einem Takt ausgeführt keine Spekulation bei der Ausführung 10 11 12 13 AG DC1 DC2 EX1 Data Cache Access Execute Ausnahmen: kurze Integer-Operationen können FloatingPoint-Instruktionen überholen (Safe Instruction Recognition -> out-of-order commits) 14 15 16 FT1 FT2 IWB Exception/ MT Handling Commit Data Prefetching Instruction Decoder (Fast Path, pre-decode extension) Folie 11 von 18

Design der Speicherzellen Maßnahmen zur Reduzierung der Leckströme: 8T-SRAM-Zellen (L1-Cache, Register Files, C6-Speicher) Sleep Transistoren Reduzierung VCC auf 750mV -2.5x Leakage Power Gating Einzelne Blöcke abschaltbar -10x Leakage Folie 12 von 18

Mögliche Ansteuerung der Sleep-Transistoren Umschalten von Active- auf Sleep-Mode durch Sperren des großen PMOS-Pull-Up genaue Kontrolle der SRAM-Versorgungsspannung im Sleep-Mode notwendig so niedrig wie möglich (Minimierung Leakage) so hoch wie nötig (Beibehaltung der gespeicherten Zustände) Folie 13 von 18

Performance Linux Kernel make SYSmark 2007 BAPCo (Preview) Cinebench 10 Rendering Atom 230 1,6GHz 1441 33 836 Celeron 430 1,8GHz 2542 63 1602 Sempron LE-1150 2,0GHz 1891 53 1530 aus c t 13/2008 Vergleichbare Performance zu einem Pentium-M 1GHz In synthetischen Benchmarks zum Teil gute ALU-Leistung, aber relativ langsame FPU Folie 14 von 18

Ausblick - Moorestown voraussichtlich 2009/2010 in die CPU integrierter Video-, Graphik- und Speichercontroller deutliche Reduzierung der Verlustleistung verbesserte Performance Folie 15 von 18

Zusammenfassung Low-Power/Low-Cost Plattform für Note- bzw. Netbooks, MIDs, Desktops kompletter x86-befehlssatz, Softwarekompatibiltät Geschwindigkeit stark abhängig von Software (In-order, Multithreading) Weiterentwicklung mit Moorestown-Plattform kein SoC, bisher keine direkte Konkurrenz zu z.b. ARM-basierten Produkten für Handys/Smartphones Folie 16 von 18

Quellen G. Gerosa, et al. A Sub-1W to 2W Low-Power IA Processor for Mobile Internet Devices and Ultra-Mobile PCs in 45nm Hi-κ Metal Gate CMOS 2008 IEEE International Solid-State Circuits Conference F. Hamzaoglu, et al. A 153Mb-SRAM Design with Dynamic Stability Enhancement and Leakage Reduction in 45nm High-K Metal-Gate CMOS Technology 2008 IEEE International Solid-State Circuits Conference Intel Intel Atom Processor Z5xx Series Datasheet Intel Press Kit Intel Developer Forum (IDF) Spring 2008, Shanghai http://www.intel.com/pressroom/kits/events/idfspr_2008/ A. Shimpi, Anandtech.com Intel's Atom Architecture: The Journey Begins http://www.anandtech.com/showdoc.aspx?i=3276 C. Windeck Atom-Versuche, Intel Diamondville alias Atom 230 und Atom N270 c t 13/2008 Folie 17 von 18

Quellen pc.watch.impress.co.jp http://pc.watch.impress.co.jp/docs/2008/0402/kaigai432.htm A. Mutschler Intel s Atom came with a fight http://www.edn.com/article/ca6569559.html P. Kedia Mobile Internet Devices Overview IDF Spring 2008, Shanghai www.eeepcnews.de http://www.eeepcnews.de/2008/04/18/intel-atom-benchmarks-via-isaiah-vergleich/ Folie 18 von 18