Token Coherence. Background
|
|
- Karsten Lang
- vor 6 Jahren
- Abrufe
Transkript
1 Token Coherence Architecture of Parallel Computer Systems WS15/16 J.Simon 1 Background single-writer or many-readers cache coherence invariant Invalidation based Protocol is a distributed algorithm of this invariant Token counting can be used to enforce the invariant T tokens are assigned to each block (T >= # of caches) One token is designed as an owner token Tokens can be held in processor caches, memory modules, and coherence messages Initially, the block s home memory module holds all tokens for a block Addition rules for handling tokens and data have to be defined Architecture of Parallel Computer Systems WS15/16 J.Simon 2 1
2 Token Counting Rules Rule #1 (Conservation of Tokens) After system initiation, tokens may not be created or destroyed. One token for each block is the owner token. The owner token can be either clean or dirty. Whenever the memory receives the owner token, the memory sets the owner token to clean. Rule #2 (Write Rule) A component can write a block only if it holds all T tokens for that block and has valid data. After writing the block, the writer sets the owner token to dirty. Rule # 3 (Read Rule) A component can read a block only if it holds at least one token for that block and has valid data. Rule #4 (Data Transfer Rule) If a coherence message contains a dirty owner token, it must contain data. Rule #5 (Valid-Data Bit Rule) A component sets valid-data bit for a block when data and at least one token arrives. Valid-data bit is cleaned when it no longer holds any tokens. Home memory sets valid-data bit whenever it receives a clean owner token. Architecture of Parallel Computer Systems WS15/16 J.Simon 3 Example Architecture with Token Coherence I/V =1 block is valid P 0 P 1 P 2 T O-T block $ I/V T O-T block $ I/V T O-T block $ I/V Ring topology uni-directional multiple messages on the ring possible max. one message per ring segment T O-T / block memory I/V standard Token O-Token (Clean/Dirty) Architecture of Parallel Computer Systems WS15/16 J.Simon 4 2
3 Ring-based Coherence Chip Multi-Processor (CMP) Ring is compromise between speed, scalability, complexity, and resource usage. An ordering of the ring is required Architecture of Parallel Computer Systems WS15/16 J.Simon 5 Example: Xeon Phi Architecture of Parallel Computer Systems WS15/16 J.Simon 6 3
4 Xeon Phi Coprocessor Architecture A single die with Up to 64 cores Dual-issue in-order execution pipelines Each core with 512 bit wide vector processor units (VPU) Core Ring Interface (CRI) Interfaces to the core and the Ring interconnect L2-Cache Tag Directory (TD), part of the distributed duplicate tag directory infrastructure Asynchronous Processor Interrupt Controller (APIC) Memory controllers (GBOX) A Gen2 PCI Express client logic (SBOX) The Ring Interconnect connecting all components Xeon Phi 5110P with 60 cores Architecture of Parallel Computer Systems WS15/16 J.Simon 7 A Xeon Phi Pentium core Intel Xeon Phi Intel MIC many integrated cores Architecture of Parallel Computer Systems WS15/16 J.Simon 8 4
5 Xeon Phi Core Architecture 64-bit execution environment, x86-64 instructions No support for MMX, AVX and SSE instructions New vector instructions (AVX-512) utilize a dedicated 512- bit wide vector floating-point unit (VPU) Support of four hardware threads Core can execute two instructions per clock cycle (1 x U- pipe + 1 x V-pipe) vector register file with 32 registers of 512-bit wide per HW thread context VPU can execute 16 SP fp Ops, 16 int32 Ops, or 8 DP fp Ops per cycle Most vector instructions have 4 clock latency with a 1 clock throughput At least two hardware contexts or threads must be run on each core, otherwise core utilization is < 50% Architecture of Parallel Computer Systems WS15/16 J.Simon 9 MIC Architecture Ring topology Cores with private L1 caches One L2 cache per core Tag directories Memory controllers Architecture of Parallel Computer Systems WS15/16 J.Simon 10 5
6 Xeon Phi x200 > 8 billion transistors Out-of-order cores > 3 TFLOPS DP 8 banks with 16 GByte near memory and >400 GByte/s bw 6 DDR4 controllers for up to 384 GByte of far memory and ~90 GByte/s bw 2d mesh with tiles 6x7 mesh 36 tiles with 2 processors each 2 extra tiles for spare processors 2 tiles for memory controllers 2 tiles for PCIe/DMI Processor core (modified Silvermont Atom core) GHz, two AVX-512 vector units, and 32kB L1-caches Two cores of a tile share a L2-cache >30 MByte x200 package including one Xeon Phi and 8 near memory banks Architecture of Parallel Computer Systems WS15/16 J.Simon 11 The Interconnect Three independent bidirectional rings Data block ring is 64 byte wide Address ring is used to send read/write commands and memory addresses Acknowledgement ring sends flow control and coherence messages Bidirectional ring Max. distance N/2 Average dist. N/4 Architecture of Parallel Computer Systems WS15/16 J.Simon 12 6
7 Alternative Multilevel Cache Architectures Architecture of Parallel Computer Systems WS15/16 J.Simon 13 Distributed Shared Cache with Directory private cache state tag data ~2 bits ~64 bits ~512 bits P0 A: M.. $ P1 $ B: S.. B: S.. P2 $ B: I.. P3 $ Network presence state tag data ~1 bit ~2 bits ~64 bits ~512 bits per proc. shared cache $ Bank 0 A: 1000 M.. $ Bank 1 $ Bank 2 B: 0110 S.. $ Bank 3 address-interleaved banking, implements cache inclusion Architecture of Parallel Computer Systems WS15/16 J.Simon 14 7
8 Distributed Shared Cache with Directory On-chip cache coherence protocol used by Intel s Core i7 Scales from 4 up to 16 cores 16-cores system adds 16 bits for each 64 byte cache line (~3% overhead) Miss to a block not cached in a private cache only introduces a small overhead in miss latency and consumed energy When blocks are shared, the traffic per miss is limited and independent of the number of cores Architecture of Parallel Computer Systems WS15/16 J.Simon 15 Scalability Some people forecast that the era of cache coherence nearing its end But State-of-the-art coherence mechanism are more scalable than we expect Scalability is also limited by Memory technology Interconnection networks Potential concerns when scaling on-chip coherence are: Traffic on the on-chip interconnection network Storage cost for tracking sharers Inefficiencies caused by maintaining inclusion (if inclusion is needed) Latency of cache misses Energy overhead Architecture of Parallel Computer Systems WS15/16 J.Simon 16 8
9 Nachfolgende Übung liefert genauere Betrachtung von Ring-basierten Systemen Architecture of Parallel Computer Systems WS15/16 J.Simon 17 Caching in MIMD-Architekturen MIMD-Architekturen Programmiermodell Behandlung der Kommunikationslatenz nachrichtenorientiert globaler Adressraum Latenz minimierend Latenz versteckend Distributed Memory Architecture Architekturen mit verteiltem Speicher Speicherzugriff: nur lokal Granularität: grob Skalierbarkeit: sehr gut Working Sets: nicht genutzt Multiprocessor System with Central Memory Architekturen mit zentralem Speicher Speicherzugriff: zentral Granularität: fein Skalierbarkeit: schlecht Working Sets: nicht genutzt Distributed Shared Memory Architecture Architekturen mit verteiltem gemeinsamen Speicher Speicherzugriff: lokal und entfernt Granularität: fein Skalierbarkeit: mittel Working Sets: im Cache genutzt Virtual Shared Memory Architecture Architekturen mit virtuell gemeinsamen Speicher Speicherzugriff: nur lokal Granularität: grob Skalierbarkeit: gut Working Sets: im lok. Sp. genutzt Multithreaded Architecture Mehr fädige Architektur Speicherzugriff: lokal und entfernt Granularität: fein oder mittel Skalierbarkeit: gut Working Sets: nicht genutzt Quelle: GiIoi 1993 Architecture of Parallel Computer Systems WS15/16 J.Simon 18 9
10 Zusammenfassung Skalierbare, cache-kohärente Systeme verwenden typischerweise SMP-Knoten Directories erweitern Protokoll über Knoten hinweg Protokolle haben eine hohe Komplexität Leistungsfähigkeit der Systeme wesentlich durch Lokalität der Daten beeinflusst Architecture of Parallel Computer Systems WS15/16 J.Simon 19 Cluster-Computing Architecture of Parallel Computer Systems WS15/16 J.Simon 20 10
11 Literatur xxx High Performance Linux Clusters, Joseph D. Sloan, O Reilly, 2005 Aktuelle Bücher und zahlreiche Tutorials sind auch im Internet zu finden Architecture of Parallel Computer Systems WS15/16 J.Simon 21 Architectural Trends ( ) SIMD MPP Cluster SMP Single Prozessor Constellation Source: top500.org Architecture of Parallel Computer Systems WS15/16 J.Simon 22 11
12 Installed Networks ( ) GbE QDR IB N/A MyriNet SDR IB FDR IB DDR IB 10GE Cray (3.6%) custom Quelle: top500.org Architecture of Parallel Computer Systems WS15/16 J.Simon 23 TOP500 Interconnect Placement (11/2013) Architecture of Parallel Computer Systems WS15/16 J.Simon 24 12
13 InfiniBand in the Top500 (6/2014) Architecture of Parallel Computer Systems WS15/16 J.Simon 25 InfiniBand Systems CPU Count Source: Mellanox Architecture of Parallel Computer Systems WS15/16 J.Simon 26 13
14 Processor Type System Share (11/2014) Source: top500.org Architecture of Parallel Computer Systems WS15/16 J.Simon 27 Accelerator Trends Source: top500.org Architecture of Parallel Computer Systems WS15/16 J.Simon 28 14
15 Accelerator Share (11/2014) Architecture of Parallel Computer Systems WS15/16 J.Simon ,000 Absolute Power Levels (6/2014) 10,000 Power [kwatts] 1, Source: top500.org Architecture of Parallel Computer Systems WS15/16 J.Simon 30 15
16 Bell s Law (1972) Gordon Bell beobachtete, dass IT-Entwicklungen in ungefähr 10-Jahreszyklen ablaufen Jede der Phasen benötigt ca. 10 Jahre Erste Forschungsarbeiten Erste Produkte und Verbesserungen Allgemeine Nutzung Auslaufen der Technologie Folgen HPC-Systeme ebenfalls diesem Gesetz? Vector / SIMD Custom Scalar Commodity Cluster Embedded / Accelerated was kommt als nächstes? Architecture of Parallel Computer Systems WS15/16 J.Simon 31 Ausnutzung von Parallelität Parallelität im Prozessor Wortbreite Fließbandverarbeitung bei der Instruktionsabarbeitung Superskalare Prozessoren mit dynamischem Inst.-Scheduling Very-Long-Instruktion-Word mit statischem Inst.-Scheduling Parallelität im Rechenknoten Multi-Socket, Multi-Chip und Multi-Core Gemeinsamer, cache-kohärenter Speicher Parallelität im Cluster aus Rechenknoten Rechenknoten mit lokalen Speichern Explizites Nachrichtenaustauschen zwischen Knoten Architecture of Parallel Computer Systems WS15/16 J.Simon 32 16
17 Cluster-Architektur Network Mem NI Mem NI Mem NI besteht aus P P P P P Knoten; handelsübliche, vollwertige PCs Durch Massenproduktion effizient in Preis/Leistung Stets aktuellste Technologie nutzbar Flexibel erweiterbar, erneuerbar, aufteilbar ohne Monitor, Tastatur, Maus, oftmals SMP-Knoten Linux auf jedem Knoten explizites Hochgeschwindigkeitskommunikationsnetzwerk für MPI P Architecture of Parallel Computer Systems WS15/16 J.Simon 33 Gründe der Akzeptanz Killer Micros Verdopplung der Leistung alle Monate (Moore s Law) PCs werden immer kostengünstiger ( Aldi-PC ) Standards ermöglichen modulare Bauweise Killer Networks Immer bessere Kommunikationsnetzwerktechnik (GbE, IBA, ) Globale Netzwerke nutzbar (Cloud-Computing) Killer Software Open-Source-Software-Projekte für Cluster-Systeme Offene Kommunikationsprotokolle (MPI) Portabilität der Anwendungen durch optimierte Compiler, Bibliotheken, Architecture of Parallel Computer Systems WS15/16 J.Simon 34 17
18 Einsatzbereiche Hochleistungsrechnen vs. Hochverfügbarkeit Kurze Antwortzeiten vs. Hoher Durchsatz Dedizierter Cluster vs. Ansammlung an PCs Homogene Knoten vs. heterogene Knoten Hochleistungskommunikationsnetzwerk vs. Standard Netzwerk Single-System-Image vs. einzeln administrierte PCs Je nach Schwerpunkt, unterschiedliche Systemarchitektur notwendig. Im weiteren Fokus sind die auf der linken Seite genannten Punkte. Architecture of Parallel Computer Systems WS15/16 J.Simon 35 Cluster-Architektur Parallel Applications Sequential Applications Parallel Programming Environments Cluster Middleware (Single System Image and Availability Infrastructure) PC/Workstation PC/Workstation PC/Workstation PC/Workstation Comm. SW Comm. SW Comm. SW Comm. SW Net. Interface HW Net. Interface HW Net. Interface HW Net. Interface HW High Speed Network/Switch Architecture of Parallel Computer Systems WS15/16 J.Simon 36 18
19 Hochgeschwindigkeitskommunikationsnetzwerke Architecture of Parallel Computer Systems WS15/16 J.Simon 37 Themen Netzwerktopologie Anordnung der Leitungen und Schalter Statisch vs. Dynamisch Vermittlungstechnik Auswahl des Kommunikationswegs Beschreibung von Kommunikationswegen Eigenständige Schalter vs. Routen über Rechenknoten Netzwerkprotokolle TCP/IP MPI auf Hochgeschwindigkeitsnetzwerk Cluster-Kommunikationsnetzwerke Beispiele: MyriNet, InfiniBand, Architecture of Parallel Computer Systems WS15/16 J.Simon 38 19
20 Bewertung von Netzwerken Netzwerk ist ein Graph G =(V,E) V ist Menge der Knoten E ist Menge an gerichtete/ungerichtete Verbindungen zwischen Knoten Kriterien eines Graphen Durchmesser Grad Kantenkonnektivität Bisektionsbreite Kriterien für ein Kommunikationsnetzwerk Latenzzeit Bandbreite Verzögerung/Übertragungszeit Durchsatz Architecture of Parallel Computer Systems WS15/16 J.Simon 39 Begriffe Grad eines Knotens Anzahl der Adjazentenkanten (ein- bzw. auslaufenden Kanten) Grad eines Netzwerks Maximaler Knotengrad Distanz eines Knotenpaars Länge des kürzesten Pfades zwischen beiden Knoten Wie viele Knoten müssen mindestens passiert werden Durchmesser eines Graphen Maximum der Distanzen aller Knotenpaare Kantenkonnektivität Minimale Anzahl an Kanten, die aus dem Graphen entfernt werden müssen, um den Graphen in zwei Teilgraphen zu zerlegen Bisektionsbreite Minimale Anzahl an Kanten, die aus dem Graphen entfernt werden müssen, um zwei Teilgraphen gleicher (±1) Größe zu zerlegen Architecture of Parallel Computer Systems WS15/16 J.Simon 40 20
21 Ziele Kleiner konstanter Grad Kosten des Netzwerks proportional zu Anzahl Pins am Chip Einfachere Skalierbarkeit Kleiner Durchmesser Kurzer längster Weg Hohe Kantenkonnektivität Mehrere unabhängige Pfade zwischen zwei Knoten Alternative Wege zur Stauvermeidung und Ausfallsicherheit Hohe Bisektionsbreite Ideal Knotenanzahl / 2 Architecture of Parallel Computer Systems WS15/16 J.Simon 41 Direkte/Statische Verbindungsnetzwerke Knoten besteht aus Schalter und Prozessor jeder Knoten hat direkte Verbindung zu seinen benachbarten Knoten. Knoten ist Teil des Verbindungsnetzwerks Knoten entscheidet über Nutzung einer Verbindung. Knoten 2 Knoten 1 P M P M Knoten 3 P M Knoten 4 P M Architecture of Parallel Computer Systems WS15/16 J.Simon 42 21
22 Indirekte/Dynamische Verbindungsnetzwerke Rechenknoten Netzwerk Aufteilung in Rechenknoten und Netzwerkkomponenten Rechenknoten haben Verbindung zum gemeinsamen Netzwerk Netzwerk schaltet bei Bedarf Verbindungen Komponenten eines Schalters Bus Schaltmatrix Klassifizierung von Netzwerken Einstufiges Netzwerk Mehrstufiges Netzwerk Architecture of Parallel Computer Systems WS15/16 J.Simon 43 Bus Eigenschaften blockierend, Shared-Medium kostengünstig sehr beschränkte Skalierbarkeit (kleine Anzahl an Knoten) Single-Bus M M M M C C C D D D Prozessoren / Speicher / Geräte Bus Multi-Bus M M M M C C C D D D Prozessoren / Speicher / Geräte Bus 1 Bus 2 Bus b Architecture of Parallel Computer Systems WS15/16 J.Simon 44 22
23 Bewertung: Bus Bus Grad = 1* Durchmesser = 1 Kantenkonnektivität = 1* Bisektionsbreite = 1 Beispiel: Ethernet Dynamisches Netzwerk CSMA/CD-Protokoll Kein Routing innerhalb eines Segments 1500 bis 9000 Byte Paketgrößen Architecture of Parallel Computer Systems WS15/16 J.Simon 45 Bewertung: Clique Vollständiger Graph (Clique) Grad = n-1 Durchmesser = 1 Kantenkonnektivität = n-1 Bisektionsbreite = n/2 n/2 Eigenschaften: Statisches Netzwerk Jeder Knoten ist direkt mit jedem anderen verbunden Kein Routing notwendig Zu teuer für große Netzwerke Architecture of Parallel Computer Systems WS15/16 J.Simon 46 23
24 Bewertung: Ring Ring Grad = 2 Durchmesser = n/2 Kantenkonnektivität = 2 Bisektionsbreite = 2 Eigenschaften: Statisches Netzwerk Jeder Knoten i ist mit Knoten (i-1) mod n und (i+1) mod n verbunden Einfaches Routing Geringe Kosten für große Netzwerke Schlechte Skalierung der Leistung Architecture of Parallel Computer Systems WS15/16 J.Simon 47 Gitterstrukturen 4 x 4 Gitter 4 x 4 Torus Pro konstanter Knotengrad Erweiterbarkeit in kleinen Inkrementen gute Unterstützung von Algorithmen mit lokaler Kommunikationsstruktur (z.b. Modellierung physikalischer Prozesse) Kontra große Netzwerke mit relativ hohem Durchmesser n Architecture of Parallel Computer Systems WS15/16 J.Simon 48 24
25 Bewertung: Gitter d-dimensionales Gitter Grad = 2d Durchmesser = d d n 1 Kantenkonnektivität = d 1 Bisektionsbreite = ( d d n) Eigenschaften: Statisches Netzwerk Hohe Kosten für Netzwerke mit hoher Dimension Relativ gute Skalierung der Leistung Architecture of Parallel Computer Systems WS15/16 J.Simon 49 Bewertung: Torus d-dimensionales Torus Grad = 2d Durchmesser = d d n 1 2 Kantenkonnektivität = 2d 1 Bisektionsbreite = 2 ( d d n) Eigenschaften: Statisches Netzwerk Hohe Kosten für Netzwerke mit hoher Dimension Relativ gute Skalierung der Leistung Architecture of Parallel Computer Systems WS15/16 J.Simon 50 25
26 Hypercube Schalter <w> ist mit Schalter <w > verbunden, genau dann, wenn sich w nur in einem Bit von w unterscheidet. Variabler Knotengrad Nur erweiterbar in Zweierpotenzen Beispiel: HQ(4) <0010> <1010> <0000> <1000> <0001> <0101> <1111> <0110> <1110> <0100> <1100> Architecture of Parallel Computer Systems WS15/16 J.Simon 51 Bewertung: Hypercube Hyperwürfel (Hypercube) Dimension k, n = 2 k Grad = k Durchmesser = k Kantenkonnektivität = k Bisektionsbreite = n/2 Eigenschaften: Statisches Netzwerk k unabängige Pfade zwischen zwei Knoten HQ(k) besteht aus zwei HQ(k-1) Architecture of Parallel Computer Systems WS15/16 J.Simon 52 26
27 Würfelartig verbundene Ringe (CCC) D-dimensionaler Hypercube, bei der jeder Knoten durch einen Ring der Länge d ersetzt wird. Jeder der d Knoten eines Rings besitzt neben den beiden Ringkanten eine Kante in Richtung einer der d-hypecube- Dimensionen. Pro konstanter Knotengrad von 3 nur in diskreten Schritten erweiter logarithmischer Durchmesser 2d d Cube Connected Cycles der Dimension 3 - CCC(3) d 2 2 d Architecture of Parallel Computer Systems WS15/16 J.Simon 53 Kreuzschienenverteiler P P P P M M M M 4 x 4 Schaltmatrix K K K K 4 x 4 Schalter Schalterzustände: B B A A Durchschaltung n 2 interne Schalter Blockierungsfrei Kreuzschaltung Fan-Out A Fan-Out B Architecture of Parallel Computer Systems WS15/16 J.Simon 54 27
28 Kreuzschienenverteiler Basisschalter: PE 0 NI PE 1 NI PE 2 NI PE 3 NI Architecture of Parallel Computer Systems WS15/16 J.Simon 55 Bewertung: Crossbar Kreuzschienenverteiler (Crossbar) Grad = 1* Durchmesser = 1* Kantenkonnektivität =? Bisektionsbreite = n/2 Eigenschaften: Dynamisches Netzwerk, einstufig Sehr hohe Leistung Hohe Kosten *als ein Schalter betrachtet. Intern konstanten Grad und mindestens O(log n) Durchmesser. Architecture of Parallel Computer Systems WS15/16 J.Simon 56 28
29 Mehrstufige Netzwerke Schaltmatrizen als Basiselemente Mehrere Ebenen als Schalter bilden Netzwerk Eigenschaften Skalierbare Netzwerke Blockierungen im Netzwerk möglich Kleine Schaltmatrizen häufig verwendet (4x4, 8x8 bis 32x32) Architecture of Parallel Computer Systems WS15/16 J.Simon 57 Topologie: Baum log n k n k-närer Baum mit i Schaltern ((k+1)-wege) k i 1 logarithmischer Durchmesser (2*log k n 1) Wurzel ist ein Engpass (Bisektionsweite 1) Beispiel: Binärbaum Architecture of Parallel Computer Systems WS15/16 J.Simon 58 29
Alternative Multilevel Cache Architectures
Alternative Multilevel Cache Architectures J. Simon - Architecture of Parallel Computer Systems SoSe 2017 < 1 > Distribute Share Cache with Directory private cache state tag ata ~2 bits ~64 bits ~512 bits
Cluster-Computing. Vorlesung: Architektur Paralleler Rechnersysteme WS08/09 J.Simon 1. Literatur
Cluster-Computing Vorlesung: Architektur Paralleler Rechnersysteme WS08/09 J.Simon Literatur xxx High Performance Linux Clusters, Joseph D. Sloan, O Reilly Builing Linux Clusters, Davi HM Spector, O Reilly
Cluster-Computing. Vorlesung: Architektur Paralleler Rechnersysteme WS13/14 J.Simon 1. Literatur
Cluster-Computing Vorlesung: Architektur Paralleler Rechnersysteme WS13/14 J.Simon 1 Literatur xxx High Performance Linux Clusters, Joseph D. Sloan, O Reilly, 005 Aktuelle Bücher un zahlreiche Tutorials
2.5. VERBINDUNGSNETZWERKE GESTALTUNGSKRITERIEN DER NETZWERKE TOPOLOGIE ALS GRAPH. Vorlesung 5 TOPOLOGIE: DEFINITIONEN : Sei G = (V, E) ein Graph mit:
Vorlesung 5.5. VERBINDUNGSNETZWERKE Kommunikation zwischen den einzelnen Komponenten eines arallelrechners wird i.d.r. über ein Netzwerk organisiert. Dabei unterscheidet man zwei Klassen der Rechner: TOOLOGIE:
Distributed Memory Computer (DMC)
Distributed Memory Computer (DMC) verteilter Speicher: jeder Prozessor kann nur auf seinen lokalen Speicher zugreifen Kopplung mehrerer Prozessoren über E/A-Schnittstellen und Verbindungsnetzwerk, nicht
Lösung von Race-Conditons beim Writeback
Lösung von Race-Conitons beim Writeback Verbine beie Operationen Sobal Writeback Directory erreicht, änere essen Zustan Nach Share, wenn ieser Busy-Share war (.h. Y fragt eine Rea-Kopie an) Nach Exclusive,
Cell Broadband Engine
Cell Broadband Engine 21.March 2006 Benjamin Keck Outline Why Cell?!? Application Areas Architectural Overview SPU Programming Model Programming on the PPE C/C++ Intrinsics The Cell Supercomputer on a
Outline. Cell Broadband Engine. Application Areas. The Cell
Outline 21.March 2006 Benjamin Keck Why Cell?!? Application Areas Architectural Overview Programming Model Programming on the PPE C/C++ Intrinsics 1 2 The Cell Supercomputer on a chip Multi-Core Microprocessor
Architektur paralleler Plattformen
Architektur paralleler Plattformen Freie Universität Berlin Fachbereich Informatik Wintersemester 2012/2013 Proseminar Parallele Programmierung Mirco Semper, Marco Gester Datum: 31.10.12 Inhalt I. Überblick
Introduction Workshop 11th 12th November 2013
Introduction Workshop 11th 12th November 2013 Lecture I: Hardware and Applications Dr. Andreas Wolf Gruppenleiter Hochleistungsrechnen Hochschulrechenzentrum Overview Current and next System Hardware Sections
Überblick. Einleitung. Befehlsschnittstelle Mikroarchitektur Speicherarchitektur Ein-/Ausgabe Multiprozessorsysteme,...
Überblick Einleitung Lit., Motivation, Geschichte, v.neumann- Modell, VHDL Befehlsschnittstelle Mikroarchitektur Speicherarchitektur Ein-/Ausgabe Multiprozessorsysteme,... Kap.6 Multiprozessorsysteme Einsatz
Weitere Verbesserungen
Weitere Verbesserungen Welcher Cache liefert aktuellen Block falls mehrere Caches Block im Zustand S halten? Lösung: Einführung eines weiteren Zustands O (Owner) Zustand O besagt: Eigentümer des Blocks
Parallelrechner (1) Anwendungen: Simulation von komplexen physikalischen oder biochemischen Vorgängen Entwurfsunterstützung virtuelle Realität
Parallelrechner (1) Motivation: Bedarf für immer leistungsfähigere Rechner Leistungssteigerung eines einzelnen Rechners hat physikalische Grenzen: Geschwindigkeit von Materie Wärmeableitung Transistorgröße
auf differentiellen Leitungen
Eingebettete Taktübertragung auf differentiellen Leitungen Johannes Reichart Kleinheubacher Tagung Miltenberg, 28.09.2009 Institut für Prof. Elektrische Dr.-Ing. und Optische Manfred Nachrichtentechnik
Routing in WSN Exercise
Routing in WSN Exercise Thomas Basmer telefon: 0335 5625 334 fax: 0335 5625 671 e-mail: basmer [ at ] ihp-microelectronics.com web: Outline Routing in general Distance Vector Routing Link State Routing
Eingebettete Taktübertragung auf Speicherbussen
Eingebettete Taktübertragung auf Speicherbussen Johannes Reichart Workshop Hochgeschwindigkeitsschnittstellen Stuttgart, 07.11.2008 Unterstützt durch: Qimonda AG, München Institut für Prof. Elektrische
Rechnerorganisation. 1. Juni 201 KC Posch
.6.2 Rechnerorganisation. Juni 2 KC Posch .6.2 2 .6.2 Front Side Bus Accelerated Graphics Port 28 MHz Front Side Bus North Bridge RAM idge South Bri IDE USB PCI Bus 3 .6.2 Front Side Bus Front Side Bus
p^db=`oj===pìééçêíáåñçêã~íáçå=
p^db=`oj===pìééçêíáåñçêã~íáçå= Error: "Could not connect to the SQL Server Instance" or "Failed to open a connection to the database." When you attempt to launch ACT! by Sage or ACT by Sage Premium for
Beispielvortrag: HPCG auf Intel Haswell-EP
Beispielvortrag: HPCG auf Intel Haswell-EP Johannes Hofmann 1 Seminarvortrag Architekturen von Multi- und Vielkern-Prozessoren Erlangen, 19.4.2016 1 Computer Architecture, University Erlangen-Nuremberg
Mehrprozessorarchitekturen
Mehrprozessorarchitekturen (SMP, UMA/NUMA, Cluster) Arian Bär 12.07.2004 12.07.2004 Arian Bär 1 Gliederung 1. Einleitung 2. Symmetrische Multiprozessoren (SMP) Allgemeines Architektur 3. Speicherarchitekturen
Memory Models. 17. September 2012
Memory Models 17. September 2012 Here Be Dragons In addition, programming idioms used by some programmers and used within Sun s Java Development Kit is not guaranteed to be valid according the existing
Gregor Michalicek, Marcus Schüler. Multiprozessoren
Gregor Michalicek, Marcus Schüler Gregor Michalicek Marcus Schüler Gregor Michalicek, Marcus Schüler Vorteile gegenüber Singleprozessoren ¾ sind zuverlässiger. Einige Multiprozessorsysteme können trotz
Tube Analyzer LogViewer 2.3
Tube Analyzer LogViewer 2.3 User Manual Stand: 25.9.2015 Seite 1 von 11 Name Company Date Designed by WKS 28.02.2013 1 st Checker 2 nd Checker Version history Version Author Changes Date 1.0 Created 19.06.2015
JONATHAN JONA WISLER WHD.global
JONATHAN WISLER JONATHAN WISLER WHD.global CLOUD IS THE FUTURE By 2014, the personal cloud will replace the personal computer at the center of users' digital lives Gartner CLOUD TYPES SaaS IaaS PaaS
Beispiele von Branch Delay Slot Schedules
Beispiele von Branch Delay Slot Schedules Bildquelle: David A. Patterson und John L. Hennessy, Computer Organization and Design, Fourth Edition, 2012 Grundlagen der Rechnerarchitektur Prozessor 97 Weniger
Hochleistungsrechnen in Darmstadt: Der Lichtenberg- Hochleistungsrechner. Dr. Andreas Wolf. Gruppenleiter Hochleistungsrechnen Hochschulrechenzentrum
Hochleistungsrechnen in Darmstadt: Der Lichtenberg- Hochleistungsrechner Dr. Andreas Wolf Gruppenleiter Hochleistungsrechnen Hochschulrechenzentrum Überblick Randbedingungen der HPC Beschaffung an der
Level 2 German, 2015
91126 911260 2SUPERVISOR S Level 2 German, 2015 91126 Demonstrate understanding of a variety of written and / or visual German text(s) on familiar matters 2.00 p.m. Friday 4 December 2015 Credits: Five
Wie groß ist die Page Table?
Wie groß ist die Page Table? Im vorigen (typischen) Beispiel verwenden wir 20 Bits zum indizieren der Page Table. Typischerweise spendiert man 32 Bits pro Tabellen Zeile (im Vorigen Beispiel brauchten
Industrial USB3.0 Miniature Camera with color and monochrome sensor
Welcome to the presentation Industrial USB3.0 Miniature Camera with color and monochrome sensor & Data rates of modern image sensors S. 1/12 Vortrag_Spectronet_USB3.0_Datenverarbeitung_ENGLISCH_Vorlage_für_pdf_v1_MH20032014
Communications & Networking Accessories
3Com10 Mbit (Combo) 3Com world leading in network technologies is a strategic partner of Fujitsu Siemens Computers. Therefore it is possible for Fujitsu Siemens Computers to offer the very latest in mobile
2 Rechnerarchitekturen
2 Rechnerarchitekturen Rechnerarchitekturen Flynns Klassifikation Flynnsche Klassifikation (Flynn sche Taxonomie) 1966 entwickelt, einfaches Modell, bis heute genutzt Beschränkung der Beschreibung auf
JAEMACOM Berlin. Benjamin Schantze IGEL Technology GmbH
JAEMACOM Berlin Benjamin Schantze IGEL Technology GmbH Agenda IGEL Technology GmbH Der Universal Desktop Ansatz IGEL Hardware / Software New UD2 LX MM Preview Q4 2012 / 2013 Universal Management Suite
2008 Jiri Spale, Programmierung in eingebetteten Systemen 1
2008 Jiri Spale, Programmierung in eingebetteten Systemen 1 NetX - Einführung 2008 Jiri Spale, Programmierung in eingebetteten Systemen 2 NetX is... a highly integrated network controller with a new system
2. Der ParaNut-Prozessor "Parallel and more than just another CPU core"
2. Der ParaNut-Prozessor "Parallel and more than just another CPU core" Neuer, konfigurierbarer Prozessor Parallelität auf Daten- (SIMD) und Thread-Ebene Hohe Skalierbarkeit mit einer Architektur neues
Geometrie und Bedeutung: Kap 5
: Kap 5 21. November 2011 Übersicht Der Begriff des Vektors Ähnlichkeits Distanzfunktionen für Vektoren Skalarprodukt Eukidische Distanz im R n What are vectors I Domininic: Maryl: Dollar Po Euro Yen 6
Infrastructure as a Service (IaaS) Solutions for Online Game Service Provision
Infrastructure as a Service (IaaS) Solutions for Online Game Service Provision Zielsetzung: System Verwendung von Cloud-Systemen für das Hosting von online Spielen (IaaS) Reservieren/Buchen von Resources
Vom Web ins IoT: Schnelleinstieg in Tooling und Entwicklung
Vom Web ins IoT: Schnelleinstieg in Tooling und Entwicklung Webinar 11.05.2017 Andreas Schmidt @aschmidt75 www.cassini.ag www.thingforward.io @thingforward 2 11.05.17 Agenda Devices für das Internet der
Granite Gerhard Pirkl
Granite Gerhard Pirkl 2013 Riverbed Technology. All rights reserved. Riverbed and any Riverbed product or service name or logo used herein are trademarks of Riverbed Technology. All other trademarks used
Virtueller Speicher und Memory Management
Virtueller Speicher und Memory Management Speicher-Paradigmen Programmierer ein großer Adressraum linear adressierbar Betriebssystem eine Menge laufender Tasks / Prozesse read-only Instruktionen read-write
MATLAB driver for Spectrum boards
MATLAB driver for Spectrum boards User Manual deutsch/english SPECTRUM SYSTEMENTWICKLUNG MICROELECTRONIC GMBH AHRENSFELDER WEG 13-17 22927 GROSSHANSDORF GERMANY TEL.: +49 (0)4102-6956-0 FAX: +49 (0)4102-6956-66
HDTV cinematic feeling with all HDMI 2.0 features, improved haptics and design packaging
HDTV cinematic feeling with all HDMI 2.0 features, improved haptics and design packaging The Cinema Series from PureLink sets an example with sophisticated and future-proof technology when it comes to
CONCURRENCY MODELS. Auf der Suche nach dem heiligen Gral der ManyCores Peter Sturm. (c) Peter Sturm, Universität Trier
CONCURRENCY MODELS Auf der Suche nach dem heiligen Gral der ManyCores Peter Sturm 1 AUTOVERKEHR 61.5 Millionen zugelassene Autos (Anfang 2014) Quelle: Statistisches Bundesamt 2 3 SPERRGRANULAT Die Zeit
TecNews: Sandy Bridge
TecNews: Sandy Bridge Werner Fischer, Technology Specialist Thomas-Krenn.AG Thomas Krenn Herbstworkshop & Roadshow 2011 23.09. in Freyung 06.10. in Wien (A) 10.10. in Frankfurt 11.10. in Düsseldorf 12.10.
Intel Xeon Phi. Praktikum Parallele Rechnerarchitekturen May 13,
Intel Xeon Phi Praktikum Parallele Rechnerarchtitekturen Praktikum Parallele Rechnerarchitekturen May 13, 2014 1 Overview Aufbau & Programmierung State-of-the-Art Manycore Chip HPC Tools Performance-Modellierung
Universität Karlsruhe (TH)
Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Parallelism in curricula An international survey November 7, 2008 Stuttgart, Germany David Meder Dr. Victor Pankratius For comments: multicore-systems@ipd.uni-karlsruhe.de
Enterprise Computing
Enterprise Computing Prof. Dr.-Ing. Wilhelm G. Spruth Teil 6 Partitionierung NUMA Sharing Disk Storage HP Superdome Cell Board 4 Itanium 2 CPU Chips 32 128 Gbyte I/O Bus mit Kühlern Hauptspeicher Anschlüsse
Systeme 1: Architektur
slide 1 Vorlesung Systeme 1: Architektur Prof. Dr. Ulrich Ultes-Nitsche Forschungsgruppe Departement für Informatik Universität Freiburg slide 2 Prüfung 18. Februar 2004 8h00-11h40 13h00-18h20 20 Minuten
Neue Dual-CPU Server mit Intel Xeon Scalable Performance (Codename Purley/Skylake-SP)
Neue Dual-CPU Server mit Intel Xeon Scalable Performance (Codename Purley/Skylake-SP) @wefinet Werner Fischer, Thomas-Krenn.AG Webinar, 17. Oktober 2017 Intel Xeon Scalable Performance _ Das ist NEU: Neue
Emulation und Rapid Prototyping. Hw-Sw-Co-Design
Emulation und Rapid Prototyping Hw-Sw-Co-Design Simulation von komplexen ICs Design level Description language Primitives Simulation time (instructions/cycle) Algorithm HLL Instruction sets 10-100 Architecture
Emulation und Rapid Prototyping
Emulation und Rapid Prototyping Hw-Sw-Co-Design Simulation von komplexen ICs Design level Description language Primitives Simulation time (instructions/cycle) Algorithm HLL Instruction sets 10-100 Architecture
Wozu dient ein Logikanalysator?
Wozu dient ein Logikanalysator? Beispiel: Microcontroller Microcontroller kommen vor in Haushaltsgeräten (Waschmaschine,...) in Fahrzeugen (ABS, Motorsteuerung, Radio,...) in Computern (Tastatur, Festplatte,
Cache Blöcke und Offsets
Cache Blöcke und Offsets Ein Cache Eintrag speichert in der Regel gleich mehrere im Speicher aufeinander folgende Bytes. Grund: räumliche Lokalität wird wie folgt besser ausgenutzt: Bei Cache Miss gleich
RS232-Verbindung, RXU10 Herstellen einer RS232-Verbindung zwischen PC und Messgerät oder Modem und Messgerät
Betriebsanleitung RS232-Verbindung, RXU10 Herstellen einer RS232-Verbindung zwischen PC und Messgerät oder Modem und Messgerät ä 2 Operating Instructions RS232 Connection, RXU10 Setting up an RS232 connection
Cilk Sprache für Parallelprogrammierung. IPD Snelting, Lehrstuhl für Programmierparadigmen
Cilk Sprache für Parallelprogrammierung IPD Snelting, Lehrstuhl für Programmierparadigmen David Soria Parra Geschichte Geschichte Entwickelt 1994 am MIT Laboratory for Computer Science Cilk 1: Continuations
IEI Graphics Grade Backplane Solution
The graphics grade backplane solution targets the applications which concern system speed and performance. It has higher performance over cost ratio than the previous PICMG 1.0 solution. PE-4S PE-5S PE-6S2
Rückschlüsse durch Host- Performance-Daten auf das Datenbankverhalten. DOAG Regio Karlsruhe 13. Juni 2013
Rückschlüsse durch Host- Performance-Daten auf das Datenbankverhalten DOAG Regio Karlsruhe 13. Juni 2013 Herrmann & Lenz Services GmbH Herrmann & Lenz Solutions GmbH Erfolgreich seit 1996 am Markt Firmensitz:
Computer: PC. Informationstechnik für Luft-und Raumfahrt Aerospace Information Technology
Computer: PC Informationstechnik für Luft-und Raumfahrt Ab Morgen nur eingebete Systeme Aber es gibt auch PCs Na gut... dann Heute. dann haben wir es hinter uns Und nicht wenige! PCs in N Jahren Industrie
GridMate The Grid Matlab Extension
GridMate The Grid Matlab Extension Forschungszentrum Karlsruhe, Institute for Data Processing and Electronics T. Jejkal, R. Stotzka, M. Sutter, H. Gemmeke 1 What is the Motivation? Graphical development
Karlsruhe Institute of Technology Die Kooperation von Forschungszentrum Karlsruhe GmbH und Universität Karlsruhe (TH)
Combining Cloud and Grid with a User Interface Jie Tao Karlsruhe Institute of Technology jie.tao@kit.edu Die Kooperation von Outline Motivation The g-eclipse Project Extending gg-eclipse for a Cloud Framework
SARA 1. Project Meeting
SARA 1. Project Meeting Energy Concepts, BMS and Monitoring Integration of Simulation Assisted Control Systems for Innovative Energy Devices Prof. Dr. Ursula Eicker Dr. Jürgen Schumacher Dirk Pietruschka,
Exercise (Part II) Anastasia Mochalova, Lehrstuhl für ABWL und Wirtschaftsinformatik, Kath. Universität Eichstätt-Ingolstadt 1
Exercise (Part II) Notes: The exercise is based on Microsoft Dynamics CRM Online. For all screenshots: Copyright Microsoft Corporation. The sign ## is you personal number to be used in all exercises. All
Die Sandy-Bridge Architektur
Fakultät Informatik - Institut für Technische Informatik - Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur Die Sandy-Bridge Architektur René Arnold Dresden, 12. Juli 2011 0. Gliederung 1.
Energieeffizienz und Performance von Networks-on-Chip
Fakultät Informatik, Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur Energieeffizienz und Performance von Networks-on-Chip Marco Zulkowski Marco.Zulkowski@mailbox.tu-dresden.de Dresden,
Cswitch Seminar. HWS 08 Von Andreas Peters. Cswitch Seminar, Andreas Peters
Cswitch Seminar Von Andreas Peters 1 Gliederung Einführung Daten / Anwendungsgebiete Aufbau: Kommunikationsstruktur Vier Tiles Sonstige Features Kleine Zusammenfassung 2 Einführung Was ist Cswitch? 3 Exceeding
Ein Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten. Click here if your download doesn"t start automatically
Ein Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten Click here if your download doesn"t start automatically Ein Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten Ein Stern in dunkler
Quiz. Gegeben sei ein 16KB Cache mit 32 Byte Blockgröße. Wie verteilen sich die Bits einer 32 Bit Adresse auf: Tag Index Byte Offset.
Quiz Gegeben sei ein 16KB Cache mit 32 Byte Blockgröße. Wie verteilen sich die Bits einer 32 Bit Adresse auf: Tag Index Byte Offset 32 Bit Adresse 31 3 29... 2 1 SS 212 Grundlagen der Rechnerarchitektur
1.2 QoS-Verbesserungen
Read Me System Software 7.9.1 PATCH 4 Deutsch Diese Version unserer Systemsoftware ist für Geräte der Rxxx2-Serie verfügbar. Folgende Änderungen sind vorgenommen worden: 1.1 Ethernet - Zusätzliche MC-Adressen
There are 10 weeks this summer vacation the weeks beginning: June 23, June 30, July 7, July 14, July 21, Jul 28, Aug 4, Aug 11, Aug 18, Aug 25
Name: AP Deutsch Sommerpaket 2014 The AP German exam is designed to test your language proficiency your ability to use the German language to speak, listen, read and write. All the grammar concepts and
SAMPLE EXAMINATION BOOKLET
S SAMPLE EXAMINATION BOOKLET New Zealand Scholarship German Time allowed: Three hours Total marks: 24 EXAMINATION BOOKLET Question ONE TWO Mark There are three questions. You should answer Question One
Seminar Multicore-Programmierung
Multicore- und GPGPU-Architekturen Fakultät für Informatik und Mathematik Universität Passau 04. November 2010 APUs / 1 / 39 Inhaltsverzeichnis I APUs / APUs / 2 / 39 Inhaltsverzeichnis II APUs / 3 / 39
Fluid-Particle Multiphase Flow Simulations for the Study of Sand Infiltration into Immobile Gravel-Beds
3rd JUQUEEN Porting and Tuning Workshop Jülich, 2-4 February 2015 Fluid-Particle Multiphase Flow Simulations for the Study of Sand Infiltration into Immobile Gravel-Beds Tobias Schruff, Roy M. Frings,
Schreiben von Pages. Schreiben einer Page in den Swap Space ist sehr teuer (kostet millionen von CPU Zyklen).
Schreiben von Pages Schreiben einer Page in den Swap Space ist sehr teuer (kostet millionen von CPU Zyklen). Write Through Strategie (siehe Abschnitt über Caching) ist hier somit nicht sinnvoll. Eine sinnvolle
Proseminar Rechnerarchitekturen. Parallelcomputer: Multiprozessorsysteme
wwwnet-texde Proseminar Rechnerarchitekturen Parallelcomputer: Multiprozessorsysteme Stefan Schumacher, , PGP Key http://wwwnet-texde/uni Id: mps-folientex,v
Introduction to Python. Introduction. First Steps in Python. pseudo random numbers. May 2016
to to May 2016 to What is Programming? All computers are stupid. All computers are deterministic. You have to tell the computer what to do. You can tell the computer in any (programming) language) you
FPGA-Based Architecture for Pattern Recognition
Institut für Technik der Informationsverarbeitung FPGA-Based Architecture for Pattern Recognition Institut für Prozessdatenverarbeitung und Elektronik - IPE, KIT University of the State of Baden-Wuerttemberg
PONS DIE DREI??? FRAGEZEICHEN, ARCTIC ADVENTURE: ENGLISCH LERNEN MIT JUSTUS, PETER UND BOB
Read Online and Download Ebook PONS DIE DREI??? FRAGEZEICHEN, ARCTIC ADVENTURE: ENGLISCH LERNEN MIT JUSTUS, PETER UND BOB DOWNLOAD EBOOK : PONS DIE DREI??? FRAGEZEICHEN, ARCTIC ADVENTURE: Click link bellow
Level 2 German, 2013
91126 911260 2SUPERVISOR S Level 2 German, 2013 91126 Demonstrate understanding of a variety of written and / or visual German text(s) on familiar matters 9.30 am Monday 11 November 2013 Credits: Five
Towards Modular Supercomputing with Slurm
Towards Modular Supercomputing with Slurm 2017-09-25 Dorian Krause et al., Jülich Supercomputing Centre, Forschungszentrum Jülich Dual-Architecture Supercomputing Facility IBM Power 4+ JUMP, 9 TFlop/s
Gateway-Lösungen für die Anbindung ans Wissenschaftsnetz X-WiN, ein Update
Gateway-Lösungen für die Anbindung ans Wissenschaftsnetz X-WiN, ein Update Oliver Faßbender, Henning Irgens 52. Betriebstagung des DFN-Verein e.v. 02./03.03.2010 Tuesday, March 09, 2010 Agenda 1. Historie
Motion Controller 2 - MC2
otion ler 2 - C2 otion ler C2 The C2 (otion ler) is the connective link between a higher-ranking control level (PLC, IPC etc.) and one or more SIEB & EYER drives (series SD2/SD2S and FC2). It receives
Verteilte Betriebssysteme
Verteiltes System Eine Sammlung unabhängiger Rechner, die dem Benutzer den Eindruck vermitteln, es handle sich um ein einziges System. Verteiltes Betriebssystem Betriebssystem für verteilte Systeme Verwaltet
Accelerating possibilities
26.10.2016 Accelerating possibilities GTUG Hannover, 26.04.2017 Mode 2: Digitalisierung 2 Digitalisierung 3. industrielle Revolution 3 Digitalisierung => 3. industrielle Revolution => Idea Economy
Microcontroller Architectures and Examples
Microcontroller Architectures and Examples Thomas Basmer telefon: 0335 5625 334 fax: 0335 5625 671 e-mail: basmer [ at ] ihp-microelectronics.com web: Outline Microcontroller in general Introduction Main
IDS Lizenzierung für IDS und HDR. Primärserver IDS Lizenz HDR Lizenz
IDS Lizenzierung für IDS und HDR Primärserver IDS Lizenz HDR Lizenz Workgroup V7.3x oder V9.x Required Not Available Primärserver Express V10.0 Workgroup V10.0 Enterprise V7.3x, V9.x or V10.0 IDS Lizenz
Oracle Public Cloud benutzen
Oracle Public Cloud benutzen 1. Service auswählen 2. Plan auswählen 3. Service konfigurieren 6. Benutzen & verwalten 5. Credentials erhalten 4. Request abschicken 1 Oracle Public Cloud Architektur Ge-Hosted,
AS Path-Prepending in the Internet And Its Impact on Routing Decisions
(SEP) Its Impact on Routing Decisions Zhi Qi ytqz@mytum.de Advisor: Wolfgang Mühlbauer Lehrstuhl für Netzwerkarchitekturen Background Motivation BGP -> core routing protocol BGP relies on policy routing
TomTom WEBFLEET Tachograph
TomTom WEBFLEET Tachograph Installation TG, 17.06.2013 Terms & Conditions Customers can sign-up for WEBFLEET Tachograph Management using the additional services form. Remote download Price: NAT: 9,90.-/EU:
Abkürzungen. Kapitel 1 - Einleitung Stand der Automobilelektronik Historische Entwicklung Gegenwärtige Probleme 2
Inhalt Abkürzungen X Kapitel 1 - Einleitung 1 1.1 Stand der Automobilelektronik 1 1.1.1 Historische Entwicklung 1 1.1.2 Gegenwärtige Probleme 2 1.2 Zielsetzung 5 1.3 Aufbau der Arbeit 6 1.4 Veröffentlichungen
Invalidierungs- und Update-basierte Cache-Kohärenz-Protokolle
Invalidierungs- und Update-basierte Cache-Kohärenz-Protokolle Architecture of Parallel Computer Systems WS15/16 J.Simon 1 SC mit Write-Back Caches Beweisidee: Behandlung von Reads wie beim Write-Through
Tuning des Weblogic /Oracle Fusion Middleware 11g. Jan-Peter Timmermann Principal Consultant PITSS
Tuning des Weblogic /Oracle Fusion Middleware 11g Jan-Peter Timmermann Principal Consultant PITSS 1 Agenda Bei jeder Installation wiederkehrende Fragen WievielForms Server braucheich Agenda WievielRAM
Protected User-Level DMA in SCI Shared Memory Umgebungen
Protected User-Level DMA in SCI Shared Memory Umgebungen Mario Trams University of Technology Chemnitz, Chair of Computer Architecture 6. Halle Chemnitz Seminar zu Parallelverarbeitung und Programmiersprachen
miditech 4merge 4-fach MIDI Merger mit :
miditech 4merge 4-fach MIDI Merger mit : 4 x MIDI Input Port, 4 LEDs für MIDI In Signale 1 x MIDI Output Port MIDI USB Port, auch für USB Power Adapter Power LED und LOGO LEDs Hochwertiges Aluminium Gehäuse
sciebo The Academic NRW Cloud Storage Service
sciebo The Academic NRW Cloud Storage Service Holger Angenent University of Münster 2 > sciebo sciebo is the brand name, short for science box Sync and share service for universities and universities of
Universität Karlsruhe (TH)
Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Netzwerk-Kenngrößen und -Topologien Prof. Dr. Walter F. Tichy Dr. Victor Pankratius A. Jannesari Vorlesung Cluster Computing Architektur
Foliensatz. Theorie und Einsatz von Verbindungseinrichtungen in parallelen Rechnersystemen
Foliensatz Center for Information Services and High Performance Computing (ZIH) Theorie und Einsatz von Verbindungseinrichtungen in parallelen Rechnersystemen Hochgeschwindigkeitskommunikationen 13. Juli
NEWSLETTER. FileDirector Version 2.5 Novelties. Filing system designer. Filing system in WinClient
Filing system designer FileDirector Version 2.5 Novelties FileDirector offers an easy way to design the filing system in WinClient. The filing system provides an Explorer-like structure in WinClient. The
Seminar Parallele Rechnerarchitekturen SS04 \ SIMD Implementierung aktueller Prozessoren 2 (Dominik Tamm) \ Inhalt. Seite 1
\ Inhalt Seite 1 \ Inhalt SIMD Kurze Rekapitulation 3Dnow! (AMD) AltiVec (PowerPC) Quellen Seite 2 \ Wir erinnern uns: Nach Flynn s Taxonomie kann man jeden Computer In eine von vier Kategorien einteilen:
Technische Informatik 1 Übung 8 Instruktionsparallelität (Rechenübung) Andreas Tretter 8./9. Dezember Bitte immer eine Reihe freilassen
Technische Informatik 1 Übung 8 Instruktionsparallelität (Rechenübung) Andreas Tretter 8./9. Dezember 2016 Bitte immer eine Reihe freilassen Ziele der Übung Verschiedene Arten von Instruktionsparallelität
Neue Prozessor-Architekturen für Desktop-PC
Neue Prozessor-Architekturen für Desktop-PC Bernd Däne Technische Universität Ilmenau Fakultät I/A - Institut TTI Postfach 100565, D-98684 Ilmenau Tel. 0-3677-69-1433 bdaene@theoinf.tu-ilmenau.de http://www.theoinf.tu-ilmenau.de/ra1/
SAFE HARBOR STATEMENT
SAFE HARBOR STATEMENT The following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated into any contract. It is not a commitment