PCI Express als Grafikschnittstelle



Ähnliche Dokumente
5. PC-Architekturen und Bussysteme

Anleitung zur Nutzung des SharePort Utility

Bei unserem letzten Ausflug in die Welt der Highend Mainboards konnten wir bereits feststellen das Intel seine Hausaufgaben gemacht hat.

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Die Hardwareausstattung unserer Schule

Schnittstellen des Computers

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

SharePoint Demonstration

Einfügen von Bildern innerhalb eines Beitrages

Installationsanleitung. Hardlock Internal PCI Hardlock Server Internal PCI

1 Aufgaben zu Wie funktioniert ein Computer?

IRF2000 Application Note Lösung von IP-Adresskonflikten bei zwei identischen Netzwerken

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Anleitung zur Nutzung des SharePort Plus

Staatlich geprüfter EDV-Führerschein

Die Komponenten in Ihrem Computer

Guide DynDNS und Portforwarding

Facharbeit Informatik. Thema:

Elektrische Logigsystem mit Rückführung

Eigene Dokumente, Fotos, Bilder etc. sichern

Mikrocontroller Grundlagen. Markus Koch April 2011

Lerndokumentation Netzteil / PSU

10. Elektrische Logiksysteme mit

s.beat DAP-10X White Paper USB Stromversorgung am Apple Macintosh und deren Auswirkung

Simulation LIF5000. Abbildung 1

ICS-Addin. Benutzerhandbuch. Version: 1.0

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Anleitung über den Umgang mit Schildern

Hardware Leitungscodierung und Protokoll

Computer: PC. Informationstechnik für Luft-und Raumfahrt Aerospace Information Technology

Nutzung von GiS BasePac 8 im Netzwerk

Synchronisierung. Kommunikationstechnik, SS 08, Prof. Dr. Stefan Brunthaler 73

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Einrichtung des DFÜ-Netzwerkes

HorstBox (DVA-G3342SD) Anleitung zur Einrichtung der Telefonie

ONE Technologies AluDISC 3.0

10.1 Auflösung, Drucken und Scannen

Anbindung LMS an Siemens S7. Information

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

RS-Flip Flop, D-Flip Flop, J-K-Flip Flop, Zählschaltungen

Computergruppe Heimerdingen Basiskurs. Karlheinz Wanja & Richard Zeitler

Übungen zur Softwaretechnik

Leitfaden zur ersten Nutzung der R FOM Portable-Version für Windows (Version 1.0)

Professionelle Seminare im Bereich MS-Office

Technische Voraussetzungen

SNr bis mit Gigabyte AMD K7 Mainboard. Konfiguration 7 und 7M

EasyWk DAS Schwimmwettkampfprogramm

Primzahlen und RSA-Verschlüsselung

SICHERN DER FAVORITEN

How-to: Webserver NAT. Securepoint Security System Version 2007nx

Zwischenablage (Bilder, Texte,...)

Hardware Leitungscodierung und Protokoll

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

QUICK INSTALLATION GUIDE

Platinen mit dem HP CLJ 1600 direkt bedrucken ohne Tonertransferverfahren

Local Control Network Technische Dokumentation

Eigenen Farbverlauf erstellen

USB. Autor Valentin Lätt Datum Thema USB Version V 1.0

PC-Umzug: So ziehen Sie Ihre Daten von Windows XP nach Windows 8 um

2 Die Terminaldienste Prüfungsanforderungen von Microsoft: Lernziele:

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Herzlich Willkommen bei der nfon GmbH

Einbauanleitung für Grafikkarten (AGP, PCI, PCIe)

Daten-Synchronisation zwischen dem ZDV-Webmailer und Outlook ( ) Zentrum für Datenverarbeitung der Universität Tübingen

Fachbereich Medienproduktion

PXI-Express für Mess-, Prüf- & Testsysteme!

T est of 1GBit/s Fiber optical communication interfaces based on FlexRIO R Series

Inbetriebnahme Profinet mit Engineer. Inhaltsverzeichnis. Verwendete Komponenten im Beispiel:

How to do? Projekte - Zeiterfassung

Festplattenwechsel und Arbeitsspeichererweiterung bei einem 4move!- Laptop von Atelco

Anleitung zur Installation des Printservers

Netzwerk einrichten unter Windows

Die Installation von D-Link WLAN Karten unter Windows Vista

Konfiguration VLAN's. Konfiguration VLAN's IACBOX.COM. Version Deutsch

TV mit dem PC verbinden (ATI)

Step by Step Remotedesktopfreigabe unter Windows Server von Christian Bartl

Programme für Windows NT, Windows 2000 und Windows XP

1. Warum gibt es Virus Meldung beim Download der Software JNVR? Aber Bitte die Datei nur aus der Webseite: herunterladen.

OUTLOOK (EXPRESS) KONFIGURATION POP3

Informationen zum neuen Studmail häufige Fragen

icloud nicht neu, aber doch irgendwie anders

teischl.com Software Design & Services e.u. office@teischl.com

Version Deutsch In diesem HOWTO wird beschrieben wie Sie Ihr vorhandenes PMS-System mit der IAC-BOX verbinden und konfigurieren.

Verwalten und Organisieren von Fotos,

Der monatliche Tarif für ein Handy wurde als lineare Funktion der Form f(x) = k x + d modelliert (siehe Grafik).

Speicher in der Cloud

Local Control Network

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Schritt für Schritt zur Krankenstandsstatistik

1. Einführung Erstellung einer Teillieferung Erstellung einer Teilrechnung 6

mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank

Wichtiger Hinweis im Bezug auf Ihre Blu- ray- Laufwerke

DOKUMENTATION VOGELZUCHT 2015 PLUS

Handbuch B4000+ Preset Manager

8. Bintec Router Redundancy Protocol (BRRP) 8.1 Einleitung

Was ist PDF? Portable Document Format, von Adobe Systems entwickelt Multiplattformfähigkeit,

Grundlagen verteilter Systeme

Transkript:

(RST-L WS 2004/05) PCI Express als Grafikschnittstelle bei Herrn Prof. Dr. Risse an der Hochschule Bremen Brünje Appelmann 26. Januar 2005

Inhaltsverzeichnis Tabellenverzeichnis 2 Abbildungsverzeichnis 3 1 Einleitung 4 2 Bus-Systeme 5 2.1 ISA............................................... 5 2.2 PCI.............................................. 6 2.3 AGP.............................................. 7 3 PCI-Express Spezifikationen 8 3.1 neue Technik......................................... 9 3.2 Grafikschnittstelle...................................... 11 3.3 Spannungsversorgung.................................... 13 3.4 Routing............................................ 14 3.5 Vergleichstabelle Bus-Systeme............................... 15 4 Dual-Grafikkarten-Systeme 16 4.1 SLI............................................... 16 4.1.1 SLI von 3dfx..................................... 16 4.1.2 SLI von NVIDIA.................................... 17 4.1.3 Video Array, Alternative von Alienware....................... 19 4.2 Hardware Voraussetzungen................................. 20 4.2.1 Hardware für SLI................................... 20 4.2.2 Hardware für Video Array.............................. 22 4.3 Vergleichstabelle Dual-Grafikkarten-Systeme....................... 23 5 Fazit 24 6 Anhang 25 6.1 Links.............................................. 25 Literaturverzeichnis 26 26. Januar 2005 Seite 1

Tabellenverzeichnis 3.1 Vergleichstabelle der Bandbreiten............................. 8 3.2 Vergleichstabelle der Bus-Systeme............................. 15 4.1 Vergleichstabelle der Dual-Grafikkarten-Systeme..................... 23 26. Januar 2005 Seite 2

Abbildungsverzeichnis 2.1 16 bit ISA Steckplatz..................................... 5 2.2 Grafikkarte an PCI-BUS................................... 6 2.3 PCI Steckplatz mit 33 MHz und 32 bit........................... 6 2.4 Grafikkarte an AGP-BUS mit DIME (Direct Memory Execution)............. 7 2.5 AGP 8x Steckplatz...................................... 7 3.1 Paralleles Bus-System.................................... 8 3.2 PCI-Express Bus....................................... 9 3.3 Aufteilung des Byte Streams auf die Lanes........................ 10 3.4 Grafikkarte an PCI-Express x16............................... 11 3.5 PCI-Express Steckplatz x16 (oben) und x1 (unten).................... 11 3.6 Belegung der Schnittstelle.................................. 12 3.7 neue optionale Stromversorgung für Grafikkarten..................... 13 3.8 Kurven/Krümmungen..................................... 14 3.9 optimales Routing (links), alternativs Routing (rechts) der Leitungsenden....... 14 3.10 symmetrischer Verlauf der Leitungen............................ 14 3.11 nicht erlaubtes Routing, keine Symmetrie der Leiterbahn!................ 14 4.1 SLI von 3dfx.......................................... 17 4.2 Split Frame Rendering von NVIDIA............................. 18 4.3 Alternate Frame Rendering von NVIDIA.......................... 18 4.4 Video Array.......................................... 19 4.5 Schnittstelle zur anderen Grafikkarte............................ 20 4.6 Brückenplatiene....................................... 20 4.7 ermöglicht die Konfiguration der Systemplatine...................... 21 4.8 zwei PCI-E Grafikkarten (oben) und der VMH (unten) in der X2 Systemplatine..... 22 4.9 Pass-Through-Kabelverbindung von den Grafikkarten zum Video Merger Hub..... 22 26. Januar 2005 Seite 3

Kapitel 1 Einleitung Die steigenden Anforderungen an die Bus-Systeme, die besonders bei den Grafikkarten sehr hoch sind, haben zur Folge, dass sich die Bus-Schnittstellen ständig weiter entwickeln. Die neuste Entwicklung für Grafikkarten, PCI-Express, soll dort Abhilfe schaffen und wird in diesem Dokument kurz vorgestellt. Es bietet einen kleine Rückblick auf die herkömlichen Schnittstellen für Grafikkarten. Im Weiteren wird die PCI-Express Spezifikation kurz vorgestellt und mit den herkömlichen Techniken verglichen. Ausserdem wird ein Blick auf Dual-Grafkkarten-Systeme geworfen, indem die verschiedenen Verfahren dieser Systeme vorgestellt werden und die benötigte Hardware beschrieben wird. 26. Januar 2005 Seite 4

Kapitel 2 Bus-Systeme In diesem Kapitel wird ein kleiner Rückblick auf verschiede Bus-System geworfen: die schon "veralteten", die noch im Einsatz befindlichen und die der neue Generation. Ich beschränke mich auf die gängigsten Systeme für Grafikkarten: sie werden kurz vorgestellt und miteinander verglichen. 2.1 ISA Anfang der 80er Jahre wurde der XT-Bus, von IBM entwickelt, als erstes Bus-System in Rechner verbaut, er hatte nur 8 Bit für Daten und war auf 4,77 MHz beschränkt. Aus dem XT-Bus wurde Mitte der 80er Jahre der ISA (Industry Standard Architecture) Bus entwickelt. Der ISA-Bus wurde mit 8 Daten und 4 Adressleitungen erweitert; somit wurde der Bus auf 16 bit Daten und 24 bit Adressleitung ausgebaut und erreicht einen Takt von 8,33 MHz. Abbildung 2.1 zeigt einen 16 bit ISA Steckplatz. Die maximal adressierbaren Speicher von 16 MB im Arbeitsspeicher reichten für Grafikkarten oft nicht aus und mussten mit aufwendigen Methoden dazu gebracht werden, in Rechnern mit mehr als 16 MB zu funktionieren. Eine Weiterentwicklung des ISA-Busses war Anfang der 90er Jahre der VLB (Vesa Local Bus); er erweitert den ISA auf 32 bit und wurde mit dem Systemtakt, maximal 40 MHz, betrieben. Aber auf Grund von Kompatibilitätsproblemen und durch Nichteinhaltung der VLB 1 Spezifikation 1.0 einiger Hersteller konnte sich die zweite Spezifikation nach dem Markterfolg des PCI-Busses nicht mehr durchsetzen. [1] Abbildung 2.1: 16 bit ISA Steckplatz 1 Vesa Local Bus 26. Januar 2005 Seite 5

2.2 PCI Der PCI (Peripheral Component Interconnection) Bus sollte, wie auch der Vesa Local Bus, die Schwächen des ISA Busses in Hinblick auf Leistungs- und Ausbaufähigkeit nicht nur wie der VLB erweitern, sondern ersetzen. Nicht nur die neuen Prozessor-Generationen sondern auch die immer schnelleren Grafikkarten und steigenden Auflösungen verlangten nach einem besseren Bussystem. 1992 wurde der PCI-Bus unter Federführung von Intel entwickelt. Daraus entstand ein unabhängiges Konsortium, die PCI- Special Interest Group 2, die für weitere Entwicklungen zuständig war und ist. In der ersten PCI Spezifikation wurde die Datenbreite auf 32 Bit festgelegt mit einer Taktgeschwindigkeit von 33 MHz, was eine theoretische Übertragungsrate von 132 MByte/sec ermöglichte. Auf Abbildung 2.2 ist das Prinzip des PCI-Busses zu sehen, Abblidung 2.3 zeigt einen PCI Steckplatz. Mit steigender Leistung der Rechnersysteme musste auch die Spezifikation des PCI Busses angepasst werden. So wurde bereits im April 1993 die Version 2.0 vorgestellt und 1995 die Version 2.1. 1996 setzte man sich unter Federführung von Intel zusammen und arbeitete an einem neuen Bussystem. Die in 2005 aktuelle PCI Spezifikation ist 3.0 und wurde am 19. April 2004 veröffentlicht. [2] Abbildung 2.2: Grafikkarte an PCI-BUS Abbildung 2.3: PCI Steckplatz mit 33 MHz und 32 bit 2 PCI-SIG, siehe 6.1 Links 26. Januar 2005 Seite 6

2.3 AGP Der Accelerated Graphics Port 3 kam 1997 in der Spezifikation 1.0 auf den Markt und ist ausschließlich für die Nutzung von Grafikkarten. Der AGP-Bus 4 besitzt eine höhere Bandbreite und ist zur Entlastung bzw. als Ergänzung des PCI Busses gedacht, indem er die Daten für die Grafikkarte abnimmt, so dass der PCI-Bus sich anderen Aufgaben widmen kann. Beim AGP-Bus besteht eine Punk-zu-Punkt-Verbindung zwischen Grafikkarte und Chipsatz, so dass die Grafikkarte direkt auf den Arbeitsspeicher zugreifen kann. In Abbildung 2.4 ist DIME 5, der direkte Speicherzugriff, zu sehen. Zum Vergleich siehe Abbildung 2.2, die Grafikkarte muss sich den PCI-Bus mit anderen Geräten teilen. Abbildung 2.4: Grafikkarte an AGP-BUS mit DIME (Direct Memory Execution) In der ersten Spezifikation wurden die Taktrate von AGP 1x auf 66 MHz festgelegt, das erlaubt mit 32 bit breitem Datenbus eine theoretische Transferrate von 264 MB/s. Bei AGP 2x wurden die Daten mit steigender und fallender Taktrate übertragen, was einer Verdopplung des Takts auf 133 MHz und der Datenrate auf 532 MB/s entspricht. Spezifikation 2 wurde für AGP 4x festgelegt, in der die Taktrate nochmal auf 266 MHz verdoppelt wurde, was einen Datendurchsatz von 1064 MB/s erlaubt. Mit AGP 8x ist die dritte Spezifikation im September 2002 erschienen, mit einer erneuten Verdopplung der Taktrate auf 533 MHz mit einem Datentransfer von 2,1 GB/s. Abbildung 2.5 zeigt einen AGP 8x Steckplatz. Es ist die letzte Spezifikation für den Bus, bevor PCI-Express erschien. [3], [4] Abbildung 2.5: AGP 8x Steckplatz 3 auch AGP, AGP-Bus 4 Accelerated Graphics Port 5 Direct Memory Execution 26. Januar 2005 Seite 7

Kapitel 3 PCI-Express Spezifikationen Der Bedarf an Bandbreite ist bei AGP nicht mehr ausreichend und liegt mit der Übertragungsrate weit hinter den der neuen Techniken, die in Rechnersystemen verarbeitet werden. Die Bandbreiten zwischen Prozessor und Arbeitsspeicher der neuen Prozessor-Generationen sind in der folgenden Tabelle aufgelistet. Prozessorhersteller : Intel AMD Typ : Pentium 4 HT Athlon 64 Sockel-Typ : 775 939 Typ : Pentium 4 Athlon 64 Systembusbandbreite : 8,5 GB/s a 8.0 GB/s b Speicherbandbreite : 8,5 GB/s (DDR2) c 6,4 GB/s (DDR) d Tabelle 3.1: Vergleichstabelle der Bandbreiten a abhängig vom Chipsatz; hier mit Front-Side-Bus von 1066MHz b HyperTransport Technologie, Vollduplex c mit Front-Side-Bus von 1066 MHz, abhängig vom Chipsatz d der Athlon 64 hat einen Integrierten Speicher-Controller Die bisherigen Bus-Systeme, hierzu gehören auch ISA, PCI und AGP, setzten auf eine parallele Datenübertragung. Es werden viele Leiterbahnen für Daten-, Steuer- und Taktsignale benötigt, siehe Abbildung 3.1. Bei einem parallelen Bus werden die Daten unidirektional übertragen, daß heist es kann entweder gesendet oder empfangen werden. Die Daten müssen synchron, also gleichzeitig, an allen Leitungen vorhanden sein um beim Taktsignal übernommen zu werden. Abbildung 3.1: Paralleles Bus-System 26. Januar 2005 Seite 8

3.1 neue Technik PCI-Express 1 wurde im August 2004 in erster Spezifikation von der PCI-SIG 2 veröffentlicht. Bei PCI-Express werden die Daten seriell übertragen. Die Verbindungen bestehen aus zwei Leitungspaaren. Die so genannten Lanes 3, in Abbildung 3.2 zu sehen, ein Paar zum Senden und eins zum Empfangen. PCI-Express ist bidirektional, das heißt, es können gleichzeitig Daten gesendet und empfangen werden. Das ermöglicht schnelleren Datenaustausch zwischen CPU, Arbeitsspeicher und Grafikkarte. Abbildung 3.2: PCI-Express Bus 1 auch PCI-E und PCIe genannt 2 PCI-SIG, siehe 6.1 Links 3 eine Lane hat zwei Leitungen in eine Richtung 26. Januar 2005 Seite 9

Die Pakete, die auf den Lanes gesendet werden, haben eine Größe von 10 bit und werden nach dem 8b/10b-Verfahren kodiert. Das ist eine serielle Kodierungstechnik; sie wandelt die 8 bit Nutzdaten in einen 10 bit langen Datenblock um. In den zwei zusätzlichen Bits sind durch aufeinander folgende Bitwechsel die Taktinformationen enthalten, mit denen sich Sender und Empfänger synchronisieren. Der Bus hat eine Taktfrequenz von 2,5 GHz, das macht eine Transferrate von 2,5 Gbit/s pro Bit je Richtung und Leitungspaar. Durch die 8b/10b-Kodierung ensteht ein Overhead von 20%, das entspricht einer Nutzdatenrate von 2,0 Gbit/s oder auch 250 MB/s pro Lane. Die Leitungspaare sind linear skalierbar, hierzu werden mehrere Lanes 4 parallel gebündelt, das ermöglicht eine Flexibilität bei der Bandbreite. Auf der physikalischen Schicht unterstützt die PCI-Express-Architektur verschiedene Breiten von Lanes. PCI-Express x1 hat 2 Lanes, eine in jede Richtung, das ergibt eine Datentransferrate von 500 MB/s. Die Anzahl der Lanes verdoppelt sich bis zu Version x16 mit 32 Lanes und erreicht damit eine Transferrate von 8 GB/s bidirektional. Abbildung 3.3 zeigt zum Beispiel, dass der Byte Stream von der physikalischen Schicht auf eine Lane, bzw. auf 4 Lanes aufgeteilt wird. Die Bytes werden kodiert, serialisiert und übertragen. [4], [5], [6], [7], [8], [9] Abbildung 3.3: Aufteilung des Byte Streams auf die Lanes 4 eine Lane hat zwei Leitungen in eine Richtung 26. Januar 2005 Seite 10

3.2 Grafikschnittstelle Als Grafikschnittstelle ist eine PCI-Express x16 Steckplatz vorgesehen, siehe Abbildung 3.4. Die Bezeichnung x16 steht für je 16 Leitungsleitungspaare in beide Richtungen, das sind 32 Lanes 5, insgesamt 64 Leitungen. Abbildung 3.4: Grafikkarte an PCI-Express x16 Auf Abbildung 3.5 ist ein PCI-Express x16 Steckplatz mit 164 Pins zu sehen, zum Vergleich ein PCI-E 6 x1 mit 36 Pins und AGP 8x mit 108 Pins, siehe Abbildung 2.5. Die lineare Skalierbarkeit der Lanes macht es möglich, dass die Schnittstellen abwärts kompatibel sind, es ist möglich, eine PCI-E x1 Karte in einen PCI-E x16 Steckplatz zu stecken. Abbildung 3.5: PCI-Express Steckplatz x16 (oben) und x1 (unten) 5 eine Lane hat zwei Leitungen in eine Richtung 6 PCI-Express 26. Januar 2005 Seite 11

Abbildung 3.6 zeigt die Belegung der Schnittstelle, es sind die verschiedenen Steckplatzversionen von PCI-Express eingezeichnet. [8], [10] Abbildung 3.6: Belegung der Schnittstelle 26. Januar 2005 Seite 12

3.3 Spannungsversorgung Die PCI-Express Grafikkarten verfügen über ein neues Konzept der Spannungsversorgung. Die Grafikkarte erhält ausschließlich über eine 3,3 V und eine 12 V Leitung Energie, im Gegensatz zu AGP-Bus fällt die 1,5 V und die 5 V Spannungsschiene weg. Um einen digitalen Bildschirm zu betreiben, wird aber eine 5 V Spannung benötigt, die auf der Grafikkarte aus der 12 V Spannung generiert wird. Hochleistungs-Grafikkarten mit AGP 8x 7 kommen auf einen Verbrauch von bis zu 80 Watt, diese Werte werden mit einer zusätzlichen Spannungsversorgung erreicht. Damit wird der in der Spezifikation festgelegte Maximalwert von 25 Watt für einen Standard-Steckplatz umgangen. Die PCI-Express Schnittstelle kann bis zu 75 Watt bereitstellen; mit einer zusätzlichen Spannungsversorgung kann eine Grafikkarte bis zu 150 Watt verbrauchen. Das setzt eine neue Obergrenze für die Leistungsaufnahme von Grafikkarten. Für die optionale Spannungsversorgung der Grafikkarten ist ein neuer sechspoliger Stecker vorgesehen, siehe Abbildung 3.7, nicht wie bisher eine Lösung mit Stromsteckern für Festplatten bzw. Diskettenlaufwerke. Für den hohen Energiebedarf werden Netzteile mit einer hohen Ausgangsleistung benötigt. Es kommen Netzteile zum Einsatz, die auch schon in Server-Systemen verwendet werden bei denen der Systemplatinen-Stromstecker vier zusätzliche Pins mit je einer 3,3 V, 5 V und 12 V Spannungsleitung sowie einer Masseleitung hat. [4], [7], [8], [11] Abbildung 3.7: neue optionale Stromversorgung für Grafikkarten 7 aus Spezifikation 3.0 26. Januar 2005 Seite 13

3.4 Routing Die am parallelen Bus, wie auch bei AGP, angeschlossenen Baugruppen werden mit einem externen Takt über einen zentralen Frequenzgeber synchronisiert. Um unterschiedliche Signallaufzeiten zu vermeiden, müssen alle Datenleitungen gleichlang sein. Bei PCI-Express muss nur die Länge eines Leitungspaares, einer Lane 8, gleich sein. Der Steuertakt wird unabhängig von einem zentralen Frequenzgeber und aus dem Datenstrom des Leitungspaares generiert 9, das ermöglicht einen asynchronen Datenverkehr. In der PCI-Express Spezifikation ist eine maximale Leitungslänge von 50,8 cm vorgeschrieben. Die Leitungen einer Lane untereinander dürfen einen Abstand von 0,2 mm und eine maximale Längenabweichung von 0,13 mm nicht unterschreiten. Der Abstand zwischen den Lanes muss mindestens 0,51 mm betragen, um Übersprechverhalten 10 zu vermeiden. Die Leitungspaare müssen symmetrisch zueinander verlaufen, der Leiterbahnverlauf soll mit maximal 45 Grad geführt werden, siehe Abbildung 3.8. Bei AGP werden die Leitungen in verschlungenen Bahnen 11 verlegt, mit Abwinklungen bis zu 90 Grad, um unterschiedliche Signallaufzeiten zu kompensieren. Abbildung 3.8: Kurven/Krümmungen Abbildung 3.9 zeigt zwei Möglichkeiten die Leitungsenden zu verlegen. Abbildung 3.9: optimales Routing (links), alternativs Routing (rechts) der Leitungsenden Auf der Abbildung 3.10 ist ein symmetrischer Verlauf der Leitungen zu sehen, Abbildung 3.11 zeigt hingegen einen unsymmetrischen Leitungsverlauf. [7], [8], [9], [11] Abbildung 3.10: symmetrischer Verlauf der Leitungen Abbildung 3.11: nicht erlaubtes Routing, keine Symmetrie der Leiterbahn! 8 zwei Leitungen entweder zum Senden oder zum Empfangen 9 embedded clock 10 crosstalk 11 Serpentinen-Routing 26. Januar 2005 Seite 14

3.5 Vergleichstabelle Bus-Systeme Hier sind alle Eckdaten in einer Tabelle zusammengefasst. Bus-System : ISA PCI AGP PCI-Express (PCI-E) Name : (I)ndustry (P)eripheral (A)ccelerated (P)eripheral (S)tandard (C)omponent (G)raphics (C)omponent (A)rchitecture (I)nterconnect (P)ort (I)nterconnect (E)xpress Jahr : 1984 1992 1997 2004/05 Spezifikationen : 16 bit 1.0; 2.0; 2.1; 1.0 (1x, 2x); 1.0a 2.2; 2.3; 3.0 2.0 (4x); 3.0 (8x) (x1; x2; x4; x8; x16) Busart : parallel parallel parallel seriell Übertragungsart : unidirektional unidirektional unidirektional bidirektional synchron synchron synchron asynchron die folgenden Daten berufen sich auf die gängigsten Grafikkarten Spezifikationen : ISA 16 bit PCI 2.0 AGP 8x PCI-E x16 Bustakt : 8,33 MHz 33 MHz 533 MHz 2,5 GHz Datenbusbreite : 16 bit 32 bit 32 bit 16 Lanepaare (32 Lanes) a max. mögliche 16 MB/s 132 MB/s 2,1 GB/s je Richtung 4 GB/s Bandbreite : Gesamt 8 GB/s b c Tabelle 3.2: Vergleichstabelle der Bus-Systeme a eine Lane hat zwei Leitungen pro Richtung, 64 Leitungen gesamt b Nutzdaten c eine Lane kann bis zu 2,5 Gbit/s Rohdaten übertragen 26. Januar 2005 Seite 15

Kapitel 4 Dual-Grafikkarten-Systeme Das Konzept 3D-Grafikprozessoren parallel arbeiten zu lassen, ist schon 1993 in Onyx-Workstations von Silicon Graphics verwendet worden, mit Systempreisen bis zu 1 Million US-Dollar. PCI-Express macht es nun möglich, diese Technik wieder einzusetzen. [12] 4.1 SLI Der Grafik- und digitale Medienprozessor Hersteller NVIDIA 1 macht sich die Eigenschaften von PCI- Express zu Nutzen, um zwei Grafikprozessoren miteinander zu verbinden. Zuvor gelang das nur 3dfx mit der Voodoo 2 über PCI. NVIDIA nennt diese Technik SLI 2 3 und hat das Kürzel von der 1998 erschienen Grafikkarte Voodoo 2, die von 3dfx auf den Markt gebracht wurde, übernommen. Ende 2000 wurde auf Grund von Fehlentscheidungen und Verzögerungen 3dfx von NVIDIA aufgekauft, vielleicht auch daher die Verwandschaft des Kürzels SLI. Im Folgenden werden die unterschiedlichen Versionen und Verfahren von SLI vorstellt. [12] 4.1.1 SLI von 3dfx SLI bedeutet bei 3dfx Scan Line Interleave und kam bei der Voodoo 2 zum Einsatz, damals noch für den PCI-BUS konzipiert. Voodoo 2 ist eine Zusatz-Grafikkarte, das bedeutet, es musste eine normale 2D-Grafikkarte vorhanden sein. Mittels eines Loop-Through-Kabels wurden die 2D-Karte und eine der Voodoo 2 Grafikkarten außerhalb des Rechners verbunden. Außerdem mussten die beiden Voodoo 2 Grafikkarten über ein Flachbandkabel verbunden werden, womit eine Steigerung der Bildwiederholungsrate von bis zu 70 %, im Vergleich mit nur einer Voodoo 2, erreicht wurde. Die erste der Voodoo 2 Grafikkarten lieferte die Texturen für die geraden Bildzeilen und die zweite die Texturen für die ungeraden Bildzeilen, wie auf Abbildung 4.1 zu sehen ist. Damit konnte das Referenz-Spiel Quake 2 in der damals hohen Auflösung von 1024 x 768 Pixel flüssig gespielt werden. [12], [13], [14] 1 NVIDIA, siehe 6.1 Links 2 Scalable Link Interface, bei NVIDIA 3 Scan Line Interleave, bei 3dfx 26. Januar 2005 Seite 16

Abbildung 4.1: SLI von 3dfx 4.1.2 SLI von NVIDIA NVIDIA hat nur das Kürzel SLI übernommen, das in diesem Fall Scalable Link Interface bedeutet und ausschließlich für PCI-Express Grafikkarten konzipiert ist. PCI-Express bietet Skalierbarkeit bei der Geometrieleistung und kann die Ausgabebilder komplett digital und verlustfrei zusammensetzten. Der AGP-Bus hat sich auf Grund von Unidirektionalität 4 und der Auslegung für nur eine Grafikkarte als ungeeignet erwiesen. NVIDIA SLI kann sich optimal an das Leistungsverhalten und die Anforderungen der Anwendung anpassen, dazu dienen verschiedene Skalieralgorithmen, SFR 5 und AFR 6. Die Koordination der Steuersignale zwischen beiden Karten läuft über eine zusätzliche physikalische Verbindung, siehe hierzu Abschnitt 4.2 Hardware Voraussetzungen. Eine der beiden Karten fungiert als Master, sie bestimmt die Arbeitsweise der zweiten Karte (Slave), übernimmt deren Ergebnisse und leitet sie zusammen mit den eigenen Bildinhalten an den Bildschirm weiter. Die Entscheidung, welches der beiden Verfahren genutzt wird, ist Sache des Treibers. [12], [13], [15] 4 Daten können nur entweder hin- oder zurückgesendet werden 5 Split Frame Rendering 6 Alternate Frame Rendering 26. Januar 2005 Seite 17

SFR Beim Split Frame Rendering übernimmt die Master-Karte das Rendern der oberen und die Slave- Karte das der restlichen unteren Bildschirmhälfte. Per Treiber kann die Lastenverteilung 7 statisch bei je 50 % festgesetzt werden oder dynamisch erfolgen. Da im unteren Bereich oft mehr Objekte gerendert werden müssen, Boden und Schattenwürfe, als in der oberen Hälfte, Decken oder Himmel, kann die Trennlinie im Interesse einer gleichmäßigeren Auslastung etwas nach unten setzen gesetzt werden, siehe Abbildung 4.2. [12], [13] Abbildung 4.2: Split Frame Rendering von NVIDIA AFR Beim Alternate Frame Rendering werden ganze Bilder (Frames) abwechselnd von beiden Grafikkarten berechnet, die Master-Karte übernimmt die geraden Bilder und die Slave-Karte die ungeraden, siehe Abbildung 4.3. AFR verdoppelt annähernd Geometire- und Renderleistung, aber es funktioniert nur bei Spielen, die das Vorberechnen mehrerer Bilder zulassen. Es soll jedoch nicht zu Verzögerungszeiten bei Reaktionen auf Benutzereingaben kommen, obwohl zwei Bilder zwischengespeichert werden. Aber gerade bei aufwändigen Spielen und hohen Qualitätseinstellungen lassen sich hohe Bildwiederholungsraten 8 erzielen, das entspricht einer durchschnittliche Steigerung von über 70 %. [12], [13] Abbildung 4.3: Alternate Frame Rendering von NVIDIA 7 Load Balancing 8 Frames per second, Fps 26. Januar 2005 Seite 18

4.1.3 Video Array, Alternative von Alienware Der Rechnersysteme Anbieter Alienware 9, bekannt für Hochleistungs-Spiele-Rechner, hat ein eigenes Dual-Grafikkarten-System entwickelt: den Video Array. Diese Technik erlaubt es, verschiedene Grafikkarten desselben Herstellers zusammenzuschalten und ist dabei nicht nur auf NVIDIA-Karten beschränkt. Ähnlich dem SFR 10 von NVIDIA werden zwei Bildteile über eine zusätzliche Erweiterungskarte, den sogegannten Video Merger Hub 11, koordiniert. Die Grafikkarten werden über ein Pass-Through-Kabel, ähnlich dem Verfahren von 3dfx, an den VHM 12 angeschlossen, an dem dann der Bildschrim angeschlossen wird. Mit seiner Software, die das so genannte Predictive Load Balancing beherrscht, kann der Video Array zwei Grafikkarten so beeinflussen, dass eine Karte 75 % und die andere die restlichen 25 % der Arbeit übernimmt. Auf der Abbildung 4.4 ist das Prinzip von Video Arrays zu sehen. [12], [13], [16], [17] Abbildung 4.4: Video Array 9 Alienware, siehe 6.1 Links 10 Split Frame Rendering 11 VMH 12 Video Merger Hub 26. Januar 2005 Seite 19

4.2 Hardware Voraussetzungen Die Systemplatine muss mit mindestens zwei PCI-E x16 Steckplätzen bestückt sein, um die Voraussetzungen für den Betrieb von zwei Grafikkarten zu gewährleisten. [12] 4.2.1 Hardware für SLI NVIDIA hat SLI nur für PCI-Express-Grafikprozessoren vorgesehen, das sind folgende Chips: NVIDIA GeForce 6600 GT, 6800 GT und 6800 Ultra. Außerdem muss auf der Systemplatine ein SLI fähiger Chipsatz vorhanden sein. Es sind Systemplatinen von verschienen Herstellern mit nforce4- SLI Chipsatz von NVIDIA erhältlich. Von Intel gibt es zur Zeit nur eine Serverplatine mit Intel i7525 Chipsatz und zwei PCI-E x16 Steckplätzen. An den Grafikkarten befindet sich eine zusätzliche Schnittstelle, siehe Abbildung 4.5, an der eine Verbindungsbrücke angebracht wird, um die Daten zwischen den Grafikkarten auszutauschen, wie auf Abbildung 4.6 zu sehen. Abbildung 4.5: Schnittstelle zur anderen Grafikkarte Abbildung 4.6: Brückenplatiene 26. Januar 2005 Seite 20

Bei einigen Systemplatinen wird mittels einer Steckkarte der Betrieb mit ein oder zwei Grafikkarten konfiguriert, siehe Abbildung 4.7 [12], [18] Abbildung 4.7: ermöglicht die Konfiguration der Systemplatine 26. Januar 2005 Seite 21

4.2.2 Hardware für Video Array Für den Video Array von Alienware ist eine spezielle Systemplatine, von Alienware namens X2, mit Intel i7525 Chipsatz vorgesehen. Des Weiteren wird zusätzlich eine Steckkarte, der Video Merger Hub, siehe Abbildung 4.8, und eine Kabelverbindung zwischen den Grafikkarten und dem VMH 13 benötigt, auf Abbildung 4.9 zu sehen. [12], [16], [17] Abbildung 4.8: zwei PCI-E Grafikkarten (oben) und der VMH (unten) in der X2 Systemplatine Abbildung 4.9: Pass-Through-Kabelverbindung von den Grafikkarten zum Video Merger Hub 13 Video Merger Hub 26. Januar 2005 Seite 22

4.3 Vergleichstabelle Dual-Grafikkarten-Systeme In dieser Übersicht sind die oben beschriebenen Dual-Grafikkarten-Systeme aufgelistet. Hersteller : 3dfx NVIDIA Alienware Jahr : 1998 2004 2004 Technik : Scan Line Interleave Scalable Link Interface Video Array (SLI) (SLI) Verwendeter 2 x 3dfx Voodoo 2 2 x NVIDIA GeForce 2 x belibige Grafikkarten Grafikchip : 6600 GT/ 6800 GT/ (des gleichen Herstellers) 6800 Ultra Mainboard Interface : PCI PCI-Express PCI-Express Verbindung der Flachbandkabel, Platine / Flachbandkabel zwei Verbindungskabel Grafikkarten : Loop-Through-Kabel (je nach Mainboard) zur Video-Merger- Hub -Karte Voraussetzungen : zusätzliche 2D-Karte Mainboard mit Mainboard mit nötig, belegt 3 PCI- 2 x PCI-Express x16 2 x PCI-Express x 16 Steckplätze Steckplätzen und Steckplätze nur von geeigneten Chipsätzen Alienware (X2) von Intel oder NVIDIA Nachteile : Qualitätsverlust duch hoher Stromverbrauch, hoher Stromverbrauch, 2D-Signals wegen hohes Betriebsgeräusch hohes Betriebsgeräusch Durchschleifens per Loop-Trough-Kabel 3D-Mehrleistung : a bis 70 % bis 90 % bis 70 % Tabelle 4.1: Vergleichstabelle der Dual-Grafikkarten-Systeme a gegenüber Singel-Grafikkarten-System [12] 26. Januar 2005 Seite 23

Kapitel 5 Fazit PCI-Express ist noch sehr neu, wird aber den AGP-Bus als Grafik-Schnittstelle und wahrscheinlich auch den PCI-Bus ablösen. Die Vorreiter dieser Technik sind die Hersteller der Grafikkarten. Mit SLI hat NVIDIA die Führungsrolle im Kampf um die Spitze der Grakikprozessoren übernommen. Der Video Array von Alienware ist noch nicht erhältlich und erscheint voraussichtlich nur auf dem US-Markt. Kurz vor Weihnachten überraschte Gigabyte 1 den Markt mit der PCI-Express-Grafikkarte 3D1, die mit zwei parallel arbeitenden NVIDIA GeForce 6600 GT Grafikprozessoren bestückt ist. Damit hat Gigabyte zwei im SLI-Modus verknüpfte Prozessoren auf einer Karte zusammengefasst. Die PCI-SIG 2 sieht eine Verdoppelung der PCI-Express Leistung vor. In ihrer nächsten PCI-Express Spezifikation, die Mitte 2005 veröffentlicht wird, soll der Datentransfer für eine Lane 3 von 2,5 Gbit/s 4 auf 5 Gbit/s angehoben werden. Damit kommt die PCI-Express x16 Schnittstelle auf je 8 GByte/s pro Richtung und eine Gesamttransferrate von 16 GByte/s. Das bedeutet, dass PCI-Express auch in industriellen Bereichen die Vorausetztung für Hochleistungs-Grafik-Systeme bietet. [18], [19], [20] Ist das schon das Ende? 1 Gigabyte, siehe 6.1 Links 2 PCI-SIG, siehe 6.1 Links 3 eine Lane sind zwei Leitungen in eine Richtung 4 Rohdaten, 2 Gbit/s oder 250MByte/s Nutzdaten 26. Januar 2005 Seite 24

Kapitel 6 Anhang 6.1 Links PCI-SIG PCI - Special Interest Groupe Industrielle Organisation zur Entwicklung und Verwaltung von PCI-Standards. http://www.pcisig.com/home NVIDIA NVIDIA Hersteller von Grafik und digitale Medienprozessor hhttp://www.nvidia.de/page/home Alienware Alienware Anbieter von Rechnersystemen bekannt für Hochleistungs-Spiele-Rechner http://www.alienware.com/main.aspx GIGABYTE Gigabyte unter anderem Hersteller von Systemplatinen und Grafikkarten http://www.gigabyte.de 26. Januar 2005 Seite 25

Literaturverzeichnis [1] Udo Wenzek: PC Bussysteme: Teil 1 - ISA und Co.; userchannel Sonntagsseite, 17.11.2002, http://www.userchannel.de/sonntagsseite/newsseite.php?datum=17.11.2002\&newsid= 53 [2] Udo Wenzek: PC Bussysteme: Teil 2 - PCI; userchannel Sonntagsseite, 24.11.2002, http://www.userchannel.de/sonntagsseite/newsseite.php?datum=24.11.2002\&newsid= 64 [3] Udo Wenzek: PC Bussysteme: Teil 3 - AGP; userchannel Sonntagsseite, 01.12.2002, http://www.userchannel.de/sonntagsseite/newsseite.php?datum=01.12.2002\&newsid= 73 [4] Thilo Bayer: Praxistest PCI Express; PC Games Hardware, 09/2004, s.116 [5] Intel Corporation: Intel 925XE Express chipset; Intel, 2005 http://www.intel.com/design/chipsets/925xe/index.htm [6] Advanced Micro Devices, Inc.: AMD Athlon 64 FX Prozessor Wettbewerbsvergleich; AMD, 2005 http://www.amd.com/de-de/processors/productinformation/0,,30_118_9485_9488% 5E9494,00.html [7] Bernhard Haluschak: PCI Express für Grafikkarten; tecchannel, 30.05.2003, http://www.tecchannel.de/hardware/1182/index.html [8] Bernhard Haluschak: PCI Express: Der Highspeed-Datenbus im Detail; tecchannel, 06.09.2002, http://www.tecchannel.de/hardware/1003/index.html [9] Hermann Strass: PCI Express: Mit Volldampf in ein neues Zeitalter; elektroniknet, 2004, http://www.elektroniknet.de/topics/kommunikation/fachthemen/2004/0004/index.htm 26. Januar 2005 Seite 26

[10] Patrick Schmid, Achim Roos: PCI Express durchleuchtet: Alle Modi im Test; tom s hardware guide, 5. November 2004, http://www.de.tomshardware.com/graphic/20041105/index.html [11] Manfred Bertuch: Pixel-Express Nvidia kündigt erste Grafikkarten mit PCI Express an; c t, 6/2004, S. 44 http://www.heise.de/ct/04/06/044/default.shtml [12] Daniel Wolff: SLI: 3D mal zwei; chip 01/2005, S. 54 [13] Raphael auf der Mauer, Thilo Bayer: Multichip-Technik SLI; PC Games Hardware 09/2004, S. 20 [14] Pierre Kretschmer: Voodoo2; Gargarmel, 2003?, http://www.gargamel.de/html/voodoo2.htm [15] NVIDIA Corporation: NVIDIA SLI; NVIDIA, 2004/05, http://www.nvidia.de/page/sli.html [16] Alienware Corporation: Alienware ALX/ Video Array; Alienware, 2004/05, http://www.alienware.com/alx_pages/main_content.aspx [17]?? : Alienware??? PCI-E??????; (chinesische Seite) pcicp.com, 18.05.2004, http://itinfo.pcicp.com/news/hardware/2004/05/18/1084844257d4561.html [18] Lars Weinand: NVIDIAs SLI-Performance: Doppelte Potenz für Halbstarke; tom s hardware guide, 23.11.2004, http://www.de.tomshardware.com/graphic/20041123/index.html [19] Lars Weinand: Gigabyte 3D1 mit 2 Chips: SLI mit einer Karte!; tom s hardware guide, 18. Januar 2005, http://www.tomshardware.de/graphic/20050118/index.html [20] (hal): PCI-SIG verdoppelt PCI Express Performance; tecchannel, 17.12.2004, http://www.tecchannel.de/news/hardware/18658/ 26. Januar 2005 Seite 27