ASIC-SYNTHESE DER SHAP-MIKROARCHITEKTUR

Ähnliche Dokumente
Untersuchung und Vorstellung moderner Grafikchiparchitekturen

DIPLOMARBEIT. Entwurf und Implementierung eines modularen USB-Stacks für eingebettete Controller ohne Betriebssystem. Uwe Pfeiffer

Entwicklung von Partitionierungsstrategien im Entwurf dynamisch rekonfigurierbarer Systeme

Vortrag zum Hauptseminar Hardware/Software Co-Design

Automatische Testsysteme und ihre Programmierung. Dresden, Michael Dittrich,

Universelle Speicherschnittstelle für große externe Speicher

Übersicht aktueller heterogener FPGA-SOCs

Vortrag zum Proseminar Architekturen der ARM CORTEX Familie

Software ubiquitärer Systeme

Platzierung und Verdrahtung massiv-paralleler FPGA-Designs am Beispiel eines Many-Core- Prozessors

Computeranwendung in der Chemie Informatik für Chemiker(innen)

Fakultätsname XYZ Fachrichtung XYZ Institutsname XYZ, Professur XYZ. Big.LITTLE-Processing mit ARM- Cortex-Prozessoren. E. Zenker

Design Compiler. VHDL Kurzbeschreibung und in dem SYNOPSYS

Samsungs Exynos 5 Dual

Fakultät Informatik, Institut für Angewandte Informatik, Professur Prozesskommunikation Entwicklung eines Profinet IO Testbetts

PROJEKT WÜRFEL. von Vincent Bootz, Christoph Beigel, Matthias Ackermann. Projekt Würfel WS2002/03

PROJEKT WÜRFEL. von Vincent Bootz, Christoph Beigel, Matthias Ackermann. Projekt Würfel WS2002/03

Verteidigung der Belegarbeit Umsetzung eines Verzeichnisdienstes für das Identitätsmanagement Seite 1 von 25

Überblick über Java-Umgebungen auf Embedded-Plattformen

Fakultät Informatik, Institut für Technische Informatik, Professur für VLSI - EDA. Implementierung eines UDP/IP-Stacks in Hardware.

Methoden zur Visualisierung von ereignisdiskreten Analysedaten

Implementierung der Jikes Research Virtual Machine

moderne Prozessoren Jan Krüger

IuK-Projekt am Institut für Mikroelektronik und Eingebettete Systeme. Prof. Dr.-Ing. Peter Schulz Sommersemester 2013

Automatisierung mit Hilfe einer rekonfigurierbaren FPGA-Hardwareplattform

Wer möchte, kann sein Programm auch auf echter Hardware testen

FlexPath - Flexible, Dynamisch Rekonfigurierbare Verarbeitungspfade in Netzwerkprozessoren

HW/SW Codesign 5 - Performance

Inhalt. Prozessoren. Curriculum Manfred Wilfling. 28. November HTBLA Kaindorf. M. Wilfling (HTBLA Kaindorf) CPUs 28. November / 9

Zellulare Neuronale Netzwerke

Softprozessoren. FPGA Development Teil II. Sven Gregori, CN8 6. November UnFUG WS 08/09 Hochschule Furtwangen

5 Zusammengesetzte und reguläre Schaltungsstrukturen

ReCoNets Entwurfsmethodik für eingebettete Systeme bestehend aus kleinen Netzwerken hardwarerekonfigurierbarer Knoten und -verbindungen

Using FRAM memory in battery-less sensors

Entwurf und Implementierung eines hochparallelen Black- Scholes Monte-Carlo-Simulators

4D Server v12 64-bit Version BETA VERSION

Technische Informatik 1

Gliederung. Wozu braucht man Anforderungsmanagement? Motivation AM. Was umfasst Anforderungsmanagement? Definition AM

Processors for mobile devices

Untersuchung zur hardwareunterstützten Entwurfsverifikation von Stream-basierten Kommunikations- und Verarbeitungsalgorithmen

Mikrocontroller Grundlagen. Markus Koch April 2011

Makros sind Textersetzungen, welche vom Präprozessor aufgelöst werden. Dies Passiert bevor der Compiler die Datein verarbeitet.

2008 Jiri Spale, Programmierung in eingebetteten Systemen 1

An den Vizepräsident für Forschung, Entwicklung und Technologietransfer der Fachhochschule Braunschweig/Wolfenbüttel

Lenovo ThinkPad Edge E530 NZQCGMZ

ARM Cortex-M Prozessoren. Referat von Peter Voser Embedded Development GmbH

Frank Kuchta Markus Rüger

Jürg Gutknecht, SI und ETH Zürich, April 2015

Unterschiede in den Konzepten von TinyOS und Embedded Linux

Vorlesung Rechnerarchitektur. Einführung

Engineering IT-basierter Dienstleistungen

Grundlagen der Rechnerarchitektur

Smart Metering: Entwicklung eines intelligenten Stromzählers

Pulse Pattern Controller

Entwicklung einer netzbasierten Methodik zur Modellierung von Prozessen der Verdunstungskühlung

Grüne Innovationen im Auto

EyeCheck Smart Cameras

Willkommen. Programmierung (MGP) von FPGAs. zur Präsentation

Realisierung eines fernsteuerbaren Testcontrollers für FPGA-basierte Systeme. Kolloquium zum Mastermodul INF-PM-FPG

Entwurf eines Generators zur Erzeugung von Hard- und Software-Beschreibungen für Bildverarbeitungspipelines

Übungen zu. Kraftfahrzeugmechatronik II

Embedded OS für ARM Cortex Microcontroller

Produktinformation. Modell: crio-9068

Reporting Lösungen für APEX wähle Deine Waffen weise

Motivation. Eingebettetes System: Aufgabe:

Energiesparmechanismen des

Prodatic Angebote 2014

Quanton Manual (de) Datum: URL: )

Einführung. Rechnerarchitekturen Entwicklung und Ausführung von Programmen Betriebssysteme

Teil 2-7. Vorlesung. Modul: Programmierung B-PRG Grundlagen der Programmierung II

Bericht zur Überprüfung und ggf. Anpassung des Einzelhandels- und Zentrenkonzeptes für die Stadt Wuppertal

Debugging mit uclinux auf ARM-Prozessoren

Linux auf FPGAs. Massgeschneiderte Computersysteme. Christoph Zimmermann, Marc-André Beck. 1. März Berner Fachhochschule MedOnStream

Technische Informatik

Überblick. Hardwareentwicklung

IHS2 Praktikum. Zusatzfolien. Integrated HW/SW Systems Group. IHS2 Praktikum Zusatzfolien 2012 Self-Organization 20 April

H mm. H mm

gsysc Visualisierung von SystemC Projekten

Realisierung einer 32'768-Punkt-FFT für 2 GBytes/s Datenrate auf einem FPGA

One of the few resources increasing faster than the speed of computer hardware is the amount of data to be processed. Bin Hu

Rechner Architektur. Martin Gülck

Modelling with SystemC

Panel-PC. 15" Display Widescreen IndraControl VPP 15

Java-Prozessoren. Die Java Virtual Machine spezifiziert... Java Instruktions-Satz. Datentypen. Operanden-Stack. Konstanten-Pool.

Performance Tuning & Scale-Out mit MySQL

Präsentation der Bachelorarbeit

Protokoll zur Lehrveranstaltung Rechnerorganisation I. Gruppe Compute PC with GTX 260/280 :

Die Architektur des Sun UltraSPARC T2 Prozessors, Anwendungsszenarien

Rhapsody in J Modellierung von Echtzeitsystemen

Mikroelektronik-Ausbildung am Institut für Mikroelektronische Systeme der Leibniz Universität Hannover

Modul A. Modul B. Bisheriger Ansatz für dynamisch und partiell rekonfigurierbare Systeme. Slot 0 Slot 1. Prozessor. Dynamischer Bereich

POB-Technology Dokumentation. POB-Technology Produkte. Deutsche Übersetzung von roboter-teile.de Alle Rechte vorbehalten Seite 1 von 13

SENYO MINI PC 940MP. II Intel Core i3/i5/i7 Prozessor. II Intel HD-Grafik II 1 x 2,5" Sata. II 1x msata. II 4 GB DDR3L SO-DIMM, max.

Embedded System Design

SS 2011 IBB4C Datenmanagement Fr 15:15 16:45 R Vorlesung #1

Embedded Software Engeneering mit dem Raspberry Pi

Smart Metering im Haushalt. Softwarelösungen Matthias Aebi, futurelab AG / digitalstrom Allianz

Quantifying Application Performance for Adaptive Power Management

Auch unterwegs bestens gerüstet mit den Fujitsu LIFEBOOKs

Transkript:

Fakultät Informatik Institut für Technische Informatik, Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur ASIC-SYNTHESE DER SHAP-MIKROARCHITEKTUR Vortrag zum großen Beleg Andrej Olunczek Andrej.Olunczek@mailbox.tu-dresden.de Dresden, 01.10.2008

Gliederung Einführung Vergleich anderer Prozessoren Realisierung Zusammenfassung TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 2 von 15

Einführung Aufgabenstellung Literaturstudium zu Flächenbedarf, Taktfrequenz und Leistungsaufnahme anderer eingebetteter Prozessoren Analyses des SHAP-VHDL-Designs und ggf. Entwurf/Generierung geeigneter Ersatzmodule mit Hilfe der Design-Tools Synthese des modifizierten Designs. Optimierung auf geringe Leistungsaufnahme und hohe Taktrate. Bestimmung der Kenndaten Chipfläche, erreichbare Taktfrequenz und Leistungsaufnahme in Abhänigkeit der Design-Parameter Zusammenfassung und Dokumentation der Ergebnisse. TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 3 von 15

Einführung Abgrenzung der Arbeit Design Beschreibung (z.b. VHDL) Technologie Bibliothek Synthese Simulation Design Regeln, Constraints (Timing etc.) Place & Route Extraktion Herstellung Post Layout Analyse TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 4 von 15

Einführung Motivation Vergleich zu anderen eingebetteten Prozessoren Vergleich zu den FPGA-Implementierungen Abschätzung der Leistungsfähigkeit der Architektur TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 5 von 15

Vergleich anderer Prozessoren Vergleich einiger Java-fähiger Prozessoren CPU ajile aj-100 Fujitsu MB86799 ARM926EJ-S Architektur 32-bit Java Proz. 32-bit Java Proz. 32-bit RISC Proz. IEEE-754 FPU IEEE-754 FPU IEEE-754 FPU Coproz. nativ Java PicoJava-II Java-Coproz. (Jazelle) 32K Data Cache 8K Data Cache 8K Data Cache 16K Microcode 8K Instr. Cache 8K Instr. Cache Technologie 0.25µm 0.25µm 0.13µm Takt 100 MHz 66 MHz 200 MHz Benchmark 2,75 CM/MHz 9,4 CM/MHz 5 CM/MHz emb. CM 3.0 Leistungsaufn. 2,5 mw/mhz 5,4 mw/mhz 0,45 mw/mhz Chipfläche 2.4mm 2 TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 6 von 15

Vergleich anderer Prozessoren Vergleich Eckdaten in Abhänigkeit der Optimierung Beispiel ARM Cortex-M3 (nur CM3Core) Takt optimiert nach Geschwindigkeit Takt optimiert nach Fläche Chipfläche optimiert nach Geschwindigkeit Chipfläche optimiert nach Fläche Takt in MHz Leistungsaufnahme optimiert nach Geschwindigkeit Leistungsaufnahme optimiert nach Fläche 250 200 150 100 50 0 180 130 90 Strukturgröße in nm 0,5 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 Chipfläche in mm² Leistungsaufnahme in mw/mhz TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 7 von 15

Vergleich anderer Prozessoren Vergleich Cachegrößen Beispiel ARM9 CPU Cache Techn. Takt Leistungsaufn. Chipfläche ARM920T 2 * 16K 0.18µm 200 MHz 0,8 mw/mhz 11.8mm 2 ARM922T 2 * 8K 0.18µm 200 MHz 0,8 mw/mhz 8.1mm 2 ARM9 ohne 0.18µm 200 MHz 0,8 mw/mhz 4.4mm 2 (theoret.) ARM920T 2 * 16K 0.13µm 250 MHz 0,25 mw/mhz 4.7mm 2 ARM922T 2 * 8K 0.13µm 250 MHz 0,25 mw/mhz 3.2mm 2 ARM9 ohne 0.13µm 250 MHz 0,25 mw/mhz 1.7mm 2 (theoret.) TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 8 von 15

Vergleich anderer Prozessoren Zusammenfassend geringere Strukturgröße geringere Fläche und Leistungsaufnahme, höherer Takt Optimierung nach Geschwindigkeit höhere Fläche, Leistungsaufnahme und Takt Optimierung nach Fläche geringere Fläche, Leistungsaufnahme und Takt Cachegröße hat großen Einfluss auf die Chipfläche TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 9 von 15

Realisierung Technologie 0.13µm von UMC für Logik, 8 Metallisierungsebenen fsc0h d sc - Faraday Standardzellenbibliothek Tools: Memaker & Synopsys Design Compiler & Cadence SOC TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 10 von 15

Realisierung Arbeitsschritte Analyse des Codes und Generierung Ersatzmodule Erstellung von RAM-Makros Optimierung der Makros nach gegebenen Punkten Hinzufügen der Padzellen, Synthese der Daten Optimierung durch geeignete Bedingungen(Timing-constraints etc.) einstellen Place & Route in iterativen Schritten Steuerung der Bedingungen, Lage der Makros und Padzellen, etc. durch Skripte Nach jeden Schritt Überprüfung der Einhaltung der Bedingung & Test durch Simulation TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 11 von 15

Realisierung Memaker TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 12 von 15

Realisierung Memaker TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 12 von 15

Realisierung Memaker Details Auflistung möglicher Konfigurationen TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 13 von 15

Realisierung Memaker Details Auflistung möglicher Konfigurationen Auswahl guter Werte für eine hohe Taktrate TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 13 von 15

Realisierung Memaker Details Auflistung möglicher Konfigurationen Auswahl guter Werte für eine hohe Taktrate Auswahl guter Werte für eine geringe Leistungsaufnahme TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 13 von 15

Realisierung Memaker Details Auflistung möglicher Konfigurationen Auswahl guter Werte für eine hohe Taktrate Auswahl guter Werte für eine geringe Leistungsaufnahme Festlegung auf eine Konfiguration für das zu nutzende RAM-Makro TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 13 von 15

Realisierung benötigte Speicher Speicher Taa(TC) DC Power AC Power Area Stack 2.230 ns 65.529µA 0.025 ma/mhz 0.453mm 2 Method Cache 1.291 ns 26.813µA 0.019 ma/mhz 0.159mm 2 Garbage Collector 0.995 ns 12.451µA 0.010 ma/mhz 0.052mm 2 Microtext 1.484 ns 4.529µA 0.004 ma/mhz 0.033mm 2 Summe 2.230 ns 109.322µA 0.058 ma/mhz 0.697mm 2 TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 14 von 15

Zusammenfassung Kompromiss zwischen hoher Taktrate und niedriger Leistungsaufnahme finden gute Optimierungsmöglichkeiten schon bei der Generierung der RAM-Makros vorhanden Anpassung der RAM-Makros an die funktionalen Besonderheiten der FPGA-Implementierung Noch viel Arbeit im Bereich der Synthese und des Place & Route TU Dresden, 01.10.2008 Synthese der SHAP-Architektur Folie 15 von 15