Intel Core Prozessoren der vierten Generation Die Evolution der Core Prozessoren
Intel Core Prozessoren: Die vierte Generation für Embedded Systems Energieeffizient mit neuer Microcode-Generation Intel führt aktuell die unter dem Codenamen Haswell bekannte vierte Generation seiner Core i-series Prozessoren in den Markt ein. Der Fokus der Embedded-Modelle liegt auf Höchstleistung, insbesondere im Vektorrechnungs- und Gleitkommabereich und der Grafikleistung konnten erstaunliche Verbesserungen erzielt werden ohne den Energieverbrauch zu steigern. Auch bei der Einführung der mittlerweile vierten Generation von Core i-series Prozessoren bleibt Intel seinem Tick-Tock Prinzip treu. Darunter versteht Intel, bei neuen Prozessorgenerationen jeweils abwechselnd die Fertigungstechnologie ( Tick ) und dann im Jahr darauf die Architektur ( Tock ) weiterzuentwickeln. Bei der jetzt eingeführten vierten Generation handelt es sich um einen Tock, also um eine Optimierung und Weiterentwicklung der Architektur, insbesondere des Microcodes. Die mit der dritten Generation ( Ivy Bridge ) neu eingeführte 22 nm Fertigungstechnologie wird beibehalten, bis dann eine zukünftige Fertigung in 14 nm Technologie den nächsten Meilenstein legen wird. COM Express Konzept, Entwicklungs Baseboard für COM Express Type 6 und conga-ts87 COM Express Modul Was bringt die neue vierte Generation - Microcode-Architektur? Durch Verbesserungen der bestehenden Architektur ist langfristig ein Effizienzgewinn von bis zu 10 % möglich. Allerdings wird es eine gewisse Zeit dauern, bis Firmware, Compiler, Betriebssysteme und Anwendungen alle Vorzüge der neuen Prozessorgeneration umsetzen. Es handelt sich hier eher um eine Evolution als eine Revolution, wie sie der Vorgänger mit seiner deutlichen Reduzierung der Verlustleistung durch die neue Fertigungstechnologie mit sich brachte. Die Effizienzverbesserung wird für Embedded Systems vornehmlich für eine Erhöhung der Leistungsfähigkeit genutzt. Besonders deutlich zeigt sich dies bei der eingebetteten On-Chip Grafik, die nicht nur eine deutlich höhere Leistung, sondern zumindest unter Volllast auch einen etwas erhöhten Stromverbrauch mit sich bringt. Dadurch und durch die neu integrierten Spannnungsreglereinheiten steigt die von Intel angegebene TDP zumindest für die in der Embedded-Produktlinie zuerst freigegebenen Quadcore-Prozessoren leicht an: beim Core i7-4700eq sind es dann 47 Watt statt 45 Watt beim Vorgänger, der aber den 2 Watt Vorteil durch Spannungsregler auf dem Modul wieder verliert. Der maximale Systemtakt (mit Turbo- Boost) für Cores und Grafik entspricht dabei jeweils in etwa dem Vorgängermodell; der Grundtakt (ohne Turbo-Boost) liegt etwas darunter. Dies erfordert noch ausgeklügeltere Kühlkonzepte wie etwa die patentierten Heatpipe basierenden Kühllösungen von congatec. So kann die hohe Rechenleistung auch tatsächlich genutzt werden und die Schutzschaltung regelt die Prozessorleistung nicht aufgrund hoher Temperaturen vorzeitig herunter. Zusätzlich hat Intel die maximal zulässige Oberflächentemperatur gegenüber der Vorgängergeneration von 105 auf 100 Grad Celsius herabgesetzt hat. Was gibt es an neuen Features? Bedeutendste Neuigkeit ist die Einführung der Vektoreinheit AVX2, die die aus SSE entstandene AVX (Advanced Vektor Extensions) ablöst. Bereits mit der letzten Generation hat Intel mit AVX die Leistungsfähigkeit der bisherigen SSE-Einheit bei Gleitkomma-Operationen durch Erweiterung der Befehlssätze von 128bit auf 256 bit Vektoren und leistungsfähigere Buffer, insbesondere einen größeren Reorder Buffer deutlich erhöht. Mit den Prozessoren der vierten Generation wurden die Buffer weiter vergrößert und die Ausführungseinheit (Execution Unit) um eine weitere Integer-ALU und eine zweite Sprungeinheit erweitert. Außerdem wurde der Befehlssatz um FMA (Fused Multiple Add) und TSX (Transactional Synchronisation Extention erweitert. Damit ist theoretisch eine Verdoppelung der Rechenleistung der Vektoreinheit gegenüber dem Vorgängermodell bei großen Fest- und Gleitkommaoperationen möglich. Nicht mehr ganz neu, aber in der Anwendung aktueller denn je, sind die Intel Advanced Encryption Standard
New Instructions (Intel AES-NI). Darunter versteht man die Auslagerung besonders rechenaufwändiger Pack- und Verschlüsselungsroutinen des bekannten Kryptographiealgorithmus AES (Advanced Encryption Standard) in Hardware. Dadurch ist leistungsfähige Verschlüsselung möglich, ohne die CPU-Cores nennenswert zu belasten. Für viele Embedded-Anwender besonders wichtig ist das stark verbesserte Power Management. Nur damit ist es möglich bei gleicher Strukturbreite und erhöhter Rechenleistung den Strombedarf auf niedrigem Niveau zu halten Die integrierte Grafikeinheit unterstützt die aktuellen Versionen on DirectX (11.1), OpenGL (4.0) und OpenCL (1.2) und eine native 4K2K-Auflösung ( bis zu 3.840 x 2160 Pixel bei DisplayPort und 4.096 x 2.304 Pixel bei HDMI ). Durch einen neuen Multi-Format-Codec wird jetzt neben MPEG-1, -2, -4, AVC und VC1 auch SVC (Scalable Video Coding/Decoding) unterstützt. Wer braucht das alles? In der heutigen Zeit und mit den Trends zu Cloud-Services und Industrie 4.0 wird Verschlüsselung für moderne, intelligente Embedded Systeme immer wichtiger. Full Disk- bzw. Endpoint-Verschlüsselung wird bei mobilen Systemen mit sensiblen Daten mehr und mehr zum Standard und ist beim Einsatz von SSDs (Solid State Disks) unverzichtbar, da hier im Gegensatz zu Festplatten die Daten praktisch nie vollständig gelöscht werden können. Fernwartung, Ablage von Daten in der Cloud oder Kommunikation mit externen Systemen oder Partnern sind ohne Datenverschlüsselung heutzutage grob fahrlässig und praktisch nicht mehr vorstellbar. Weitere Einsatzgebiete für Kryptographie sind Applikationen wie Datenbanken, Datenkompression und Backups. AES-NI wird dabei bereits jetzt von den meisten Betriebssystemen und vielen marktführenden Applikationen unterstützt. Mit Intel AES-NI ist leistungsfähige und sichere Kryptografie jetzt auch bei kleineren Embedded Systemen ohne Leistungseinbußen bei der Applikation möglich. Der Fokus von Intel bei der aktuell vorgestellten Ausführung der vierten Generation Intel Core Prozessoren liegt eindeutig auf Leistungseffizienz. Besonders deutlich wird dies an den Erweiterungen des Befehlssatzes und der Vektoreinheit, bei der sich die ohnehin schon hohe Leistungsfähigkeit fast verdoppelt. Besonders hiervon profitieren anspruchsvolle wissenschaftliche Berechnungen wie zum Beispiel Simulationen und CAD sowie bildgebende/ bildverarbeitende Verfahren wie Tomografie und Radar oder auch optische Inspektion. Alternativ oder zusätzlich können auch die Verarbeitungseinheiten der integrierten Grafik über OpenCL genutzt werden. Mit dem neuen, variablen Coder und der 4K2-Unterstützung lassen sich auch anspruchsvolle Multimedia- und Gaming- Anwendungen realisieren Die Hardware Produktbild, conga-ts87 4. Generation Intel Core i7 COM Express Modul Basic Typ 6 basiert auch weiterhin auf der mit der dritten Generation eingeführten, Strom sparenden 22nm-Architektur; die integrierte Grafik erhält bei der für die aktuellen Embedded-Prozessoren vorgesehenen GT2- Grafik zusätzliche Ausführungseinheiten; 16 und später 20. In der standard embedded Ausführung besteht der Chipsatz wie bisher aus 2 Komponenten. Neu sind die integrierten Spannungsregler, die Stücklisten und Flächenbedarf der Lösung weiter reduzieren, auch wenn dadurch die Verlustleistung des Chipsets trotz besseren Wirkungsgrades steigt. Die mit 47W definierte TDP des Topmodells Core i7-4700eq stellt für kleine, lüfterlose Embedded-Systeme eine Herausforderung dar. Ein hoch leistungsfähiges Kühlkonzept ist daher hier noch wichtiger als beim Vorgänger besonders wegen der integrierten Spannungsregler und durch die gesunkene maximal erlaubte Temperatur sowie der damit verbundenen Hot-Spot-Thematik. Wichtig ist hierbei nicht nur die Kühlleistung an sich, sondern vor allem auch eine gute Hitzespreizung und dadurch eine schnelle Wärmeabfuhr. Ohne aufwändige Technik wie etwa Heat Pipes und große Kühlflächen ist das schwer zu realisieren.
COM Express Type 6 A-B Connector LVDS/eDP CRT Ethernet PCIe Port 5 PCIe Port 4 PCIe Port 3 PCIe Port 2 PCIe Port 1 PCIe Port 0 LVDS/eDP edp to LVDS Bridge Ethernet 10/100/1000 Intel I218LM edp 4th Generation Intel Core Processor CPU Platform Turbo Boost 2.0 Technology HT Technology AVX2 AMT 9.0 SSE4.2 TXT VT AES-NI TSX Integrated Intel HD Graphics Digital Display Interfaces DisplayPort 1.2 HDMI 1.4 (3D, 4k) DVI Hardware Graphics Accelerators 3D Vector Graphics 2D DXVA Video Codecs APIs MPEG-2 OpenCL 1.2 H.264 OpenGL 4.0 WMV9 DirectX 11.1 2x SO-DIMM (X1/X2) Dual Channel DDR3L PEG x16 (x16/x8/x4) PECI COM Express Type 6 A-B Connector PEG x16 DP/HDMI Port B DP/HDMI Port C DP/HDMI Port D HDA I/F USB Port 0..7 LPC Bus SATA Port 0 SATA Port 1 SATA Port 2 SATA Port 3 I2C Bus LID#/SLEEP# FAN control TPM I2C CRT PCIe7 x1 PCIe6 x1 PCIe0 - PCIe5 x1 HDA USB 2.0 LPC SATA0 - SATA3 Mobile Intel 8 Series Chipset QM87 Display Interface VGA PCIe FDI DDC High Definition Audio ASRC I/O Interfaces LPC Bus SATA USB 2.0 DMI x4 USB 3.0 Flash 0 Flash 1 Congatec Board Controller Monitoring X PCIe Port 7 PCIe Port 6 USB 3.0 Port 0 USB 3.0 Port 1 USB 3.0 Port 2 USB 3.0 Port 3 (TX BC) congatec custom Blockschalt Diagramm conga-ts87 conga-ts87: Die ersten Implementierungen als COM Das conga-ts87 nutzt mit seinem Pin Out vom Typ 6 die Vorzüge der integrierte Grafik mit ihren erweiterten digitalen Display Interfaces, den hohen Bandbreiten von USB3.0 und PCIe 3.0 mit weiteren PCI Express Lanes. Das COM Express Modul ist derzeit mit dem embedded Quad Core Prozessor Intel Core i7-4700eq mit 6MB L2 Cache lieferbar und kann mit 4x 2,4 GHz und einer TDP von 47W betrieben werden. Im Turbo Boost Modus wird dann der Takt auf 3,4 GHz erhöht. Erst wenn die Temperatur des Prozessors dadurch stark ansteigt wird dieser Modus wieder runtergeschaltet. Eine gute Kühlung mit schneller Wärmeabfuhr steigert damit also die Gesamtperformance deutlich. Das COM ist mit dem Mobile Intel QM87 Express Chipset ausgestattet und kann unmittelbar nach deren Verfügbarkeit alternativ auch mit diversen zukünftigen i3, i5 und i7 Dual Core und Quad Core Prozessoren bestückt werden. Das Modul verfügt über bis zu 16 GByte, 1600 MT/s schnellen LV 1,35V Dual-Channel DDR3-Speicher. Die integrierte, gegenüber dem Vorgängermodell deutlich leistungsfähigere Grafik unterstützt Intel Flexible Display Interface (FDI), DirectX 11.1, OpenGL 4, OpenCL 1.2, sowie eine hoch performante, flexible Hardware Dekodierung, um auch mehrfach hochauflösende Full HD Videos parallel dekodieren zu können. 4K2K-Auflösung mit bis zu 3.840 x 2160 Pixeln bei DisplayPort und 4.096 x 2.304 Pixeln bei HDMI wird nativ unterstützt. Darüber hinaus ist eine Anbindung der bis zu drei unabhängigen Display Interfaces auch noch mittels DVI sowie LVDS und VGA möglich. Die native USB 3.0 Unterstützung des Moduls sorgt für eine schnelle Datenübertragung bei geringem Energieverbrauch. Insgesamt werden acht USB Ports bereitgestellt, vier davon sind in der Lage USB 3.0 Superspeed zu unterstützen. Sieben PCI Express 2.0 Lanes, PCI Express Graphik 3.0 (PEG) x16 Lanes für hochleistungsfähige externe Grafikkarten, vier SATA Schnittstellen mit bis zu 6 Gb/s und RAID-Unterstützung und eine Gigabit Ethernet-Schnittstelle ermöglichen schnelle und flexible Systemerweiterungen. Lüfterkontrolle, LPC-Bus für die einfache Anbindung von Legacy I/O Schnittstellen und das Intel High-Definition Audio runden das Funktionsset ab. Unverzichtbar: Die passende Kühlung
Die mit 47W definierte TDP des Topmodells Intel Core i7-4700eq liegt kann bei kompakten Embedded Systemen mit einfachen Mitteln nicht mehr abgeführt werden. Abhilfe schafft hier die speziell von congatec entwickelte und zum Patent angemeldete, modulare Hochleistungs-Kühllösung für COM Systeme. Hier wird die Wärme von CPU und Chipsatz durch voneinander unabhängige Wärmekoppler mit jeweils eigenen Heatpipes von den Bausteinen abgeführt und auf eine spezielle Verteilerplatte geleitet. Von dort kann die Abwärme bei geringeren Leistungen bis etwa 37 Watt und im normalen Kühlbereich mittels eines integrierten Kühlkörpers direkt an die Umgebungsluft abgeführt werden Bei größeren TDP-Leistungen und im erweiterten Temperaturbereich kann der Heatspreader zur Wärmeableitung direkt auf ein größeres Metallgehäuse oder eine geeignete Gerätewand montiert werden. Beschreibung der einzelnen Komponenten der patentierten congatec Cooling Pipe Kühllösung Zusammenfassung und Ausblick Intel verteidigt mit der vierten Generation der Core i-famile erfolgreich seine Marktführerschaft im Bereich der Hochleistungs-Embedded Systeme und setzt mit seinen Befehlssatzerweiterungen AVX2, FMA und TSX leistungsmäßig neue Maßstäbe in den Bereichen Gleitkomma- und Vektorberechnung. Der unschätzbare Vorteil für den Anwender ist, dass er zur Nutzung des Leistungszuwachses seine Anwendungssoftware oder sein Konzept zumeist nicht ändern muss - die Anpassung erledigen die Betriebssystemhersteller und Compilerbauer. Jetzt in der ersten Phase der Markteinführung der vierten Generation Core Prozessoren liegt der Schwerpunkt auf Höchstleistung und der Einführung der neuen Architektur, wovon vornehmlich die Anwender leistungshungriger Applikationen wie numerische Berechnung und Simulation, Bildverarbeitung, Tomographie und Radar und dank der gesteigerten Grafikleistung auch die Hersteller von Multimedia- und Gaming-Systemen profitieren. Noch interessanter wird es dann für die klassischen Embedded Anwendungen wenn zu einem bisher nicht genannten Zeitpunkt in einer zweiten Welle die auf Energieeffizienz optimierten Quad Cores und die Dual Cores vorgestellt werden. Insgesamt ist Intel wieder ein großer Wurf gelungen. Gut, dass Firmen wie congatec mit dem conga-ts87 bereits jetzt schon leistungsfähige, marktreife COM-Module mit ausgefeilter Firmware und exzellenten Treibersupport liefern können und damit ab sofort frühe, für den Kunden aber dennoch risikofreie Design-Ins möglich sind. Dank der modularen COM Express Technologie lassen sich auch die zukünftigen Technologieverbesserungen bei Prozessoren und Chipsätzen immer schnell und einfach integrieren. Dipl. Ing. (FH) Markus Hofmeister studierte Elektrotechnik an der Fachhochschule in Regensburg. 1999 entwarf er den ETX Standard und entwickelte schon das erste Intel Pentium Design für diesen Formfaktor. Jetzt entwickelt er als Teamleiter Entwicklung für x86 Hardware die 4. Generation Intel Core Prozessoren auf COM Express