Modul IP7: Rechnerstrukturen

Größe: px
Ab Seite anzeigen:

Download "Modul IP7: Rechnerstrukturen"

Transkript

1 Modul IP7: 4 Speicherhierarchie Norman Hendrich Universität Hamburg MIN Fakultät, Department Informatik Vogt-Kölln-Str. 30, D Hamburg hendrich@informatik.uni-hamburg.de WS 203/204 Norman Hendrich

2 Inhalt Universität Hamburg. Die Speicherhierarchie Motivation und Konzept SRAM-DRAM Cache Virtueller Speicher Festplatten RAID CD-ROM und DVD Norman Hendrich 2

3 Die Speicherhierarchie - Motivation und Konzept Speicherhierarchie: Konzept Smaller, faster, and costlier (per byte) storage devices Larger, slower, and cheaper (per byte) storage devices L5: L4: L3: L2: L0: registers L: on-chip L cache (SRAM) off-chip L2 cache (SRAM) main memory (DRAM) local secondary storage (local disks) remote secondary storage (distributed file systems, Web servers) CPU registers hold words retrieved from L cache. L cache holds cache lines retrieved from the L2 cache memory. L2 cache holds cache lines retrieved from main memory. Main memory holds disk blocks retrieved from local disks. Local disks hold files retrieved from disks on remote network servers. Norman Hendrich 3

4 Die Speicherhierarchie - Motivation und Konzept Speicherhierarchie: Konzept Gesamtsystem kombiniert verschiedene Speicher wenige kbyte Register (-bank) im Prozessor einige MByte SRAM als schneller Zwischenspeicher einige GByte DRAM als Hauptspeicher einige TByte Festplatte als nichtflüchtiger Speicher Hintergrundspeicher (CD/DVD/BR, Magnetbänder) das WWW und Cloud-Services Kompromiss aus Kosten, Kapazität, Zugriffszeit Illusion aus großem schnellem Speicher funktioniert nur wegen räumlicher/zeitlicher Lokalität Norman Hendrich 4

5 Die Speicherhierarchie - Motivation und Konzept L0: Register Register im Prozessor integriert Program-Counter und Datenregister für Programmierer sichtbar ggf. weitere Register für Systemprogrammierung zusätzliche unsichtbare Register im Steuerwerk Flipflops oder Registerbank mit 6T-Speicherzellen Lesen und Schreiben in jedem Takt möglich ggf. mehrere parallele Lesezugriffe in jedem Takt Zugriffszeiten ca. 00 ps typ. Größe einige kbyte, z.b. 32 Register á 32-bit Norman Hendrich 5

6 Die Speicherhierarchie - Motivation und Konzept L-L3: Halbleiterspeicher: SRAM und DRAM Random-Access Memory aufgebaut aus Mikrochips SRAM (6T-Zelle) oder DRAM (T-Zelle) Technologie mehrere RAM Chips bilden einen Speicher Norman Hendrich 6

7 Die Speicherhierarchie - Motivation und Konzept L4: Festplatten dominierende Technologie für nichtflüchtigen Speicher hohe Speicherkapazität, derzeit ca. TB Daten bleiben beim Abschalten erhalten aber langsamer Zugriff besondere Algorithmen, um langsamen Zugriff zu verbergen Einsatz als Speicher für dauerhafte Daten Einsatz als erweiterter Hauptspeicher ( virtual memory ) FLASH/SSD zunehmend als Ersatz für Festplatten Halbleiterspeicher mit sehr effizienten multibit-zellen Verwaltung (derzeit) wie Festplatten signifikant schnellere Zugriffszeiten Norman Hendrich 7

8 Die Speicherhierarchie - Motivation und Konzept L5: Hintergrundspeicher Archivspeicher und Backup für (viele) Festplatten Magnetbänder RAID-Verbund aus mehreren Festplatten optische Datenspeicher: CD-ROM, DVD-ROM, BlueRay WWW und Internet-Services, Cloud-Services enorme Speicherkapazität langsame Zugriffszeiten Cloud-Farms ggf. ähnlich schnell wie L4 Festplatten, da Netzwerk schneller als der Zugriff auf eine lokale Festplatte in dieser Vorlesung nicht behandelt Norman Hendrich 8

9 Die Speicherhierarchie - Motivation und Konzept Speicherhierarchie: zwei Beispiele Norman Hendrich 9

10 Die Speicherhierarchie - SRAM-DRAM Wiederholung: Halbleiterspeicher SRAM statisches RAM jede Zelle speichert Bits mit einer 6-Transistor Schaltung speichert Wert solange es mit Energie versorgt wird unanfällig für Störungen wie elektrische Brummspannungen schneller und teurer als DRAM DRAM dynamisches RAM ein Kondensator und ein Transistor pro Zelle der Wert muss alle 0-00 ms aufgefrischt werden anfällig für Störungen langsamer und billiger als SRAM Norman Hendrich 0

11 Die Speicherhierarchie - SRAM-DRAM SRAM vs. DRAM SRAM DRAM Zugriffszeit ns ns t rac ns t cac ns t cyc Leistungsaufnahme mw mw Speicherkapazität < 72 Mbit < 4 Gbit Preis 0 /Mbit 0, Ct./Mbit Tran. Access per bit time Persist? Sensitive? Cost Applications SRAM 6 X Yes No 00x cache memories DRAM 0X No Yes X Main memories, frame buffers Norman Hendrich

12 Die Speicherhierarchie - SRAM-DRAM DRAM Organisation (d w) DRAM: organisiert als d-superzellen mit w-bits 6 x 8 DRAM chip cols (to CPU) memory controller 2 bits / addr 8 bits / data 0 rows 2 3 supercell (2,) internal row buffer Norman Hendrich 2

13 Die Speicherhierarchie - SRAM-DRAM Beispiel: Lesen der DRAM Zelle (2,).a Row Access Strobe (RAS) wählt Zeile 2.b Zeile aus DRAM Array in Zeilenpuffer ( Row Buffer ) kopieren memory controller RAS = 2 2 / addr 6 x 8 DRAM chip 0 rows 2 cols / data 3 internal row buffer Norman Hendrich 3

14 Die Speicherhierarchie - SRAM-DRAM Beispiel: Lesen der DRAM Zelle (2,) 2.a Column Access Strobe (CAS) wählt Spalte 2.b Superzelle (2,) aus Buffer lesen und auf Datenleitungen legen To CPU supercell (2,) memory controller CAS = 2 / addr 8 / data 6 x 8 DRAM chip 0 rows 2 3 cols supercell (2,) internal row buffer Norman Hendrich 4

15 Die Speicherhierarchie - SRAM-DRAM Speichermodule addr (row = i, col = j) DRAM 7 DRAM 0 : supercell (i,j) 64 MB memory module consisting of eight 8Mx8 DRAMs bits bits bits bits bits 24-3 bits 6-23 bits 8-5 bits bit doubleword at main memory address A 0 Memory controller 64-bit doubleword Norman Hendrich 5

16 Die Speicherhierarchie - SRAM-DRAM Bussysteme verbinden CPU und Speicher Systembus im Rechner zur Übertragung von Adressen, Daten und Kontrollsignalen zum Anschluß von mehreren Geräten genutzt ggf. getrennte Busse für Hauptspeicher und Peripherie CPU chip register file ALU system bus memory bus bus interface I/O bridge main memory Norman Hendrich 6

17 Die Speicherhierarchie - SRAM-DRAM Lesender Speicherzugriff (). CPU legt Adresse A auf den Speicherbus register file Load operation: movl A, %eax %eax ALU bus interface I/O bridge A main memory 0 x A Norman Hendrich 7

18 Die Speicherhierarchie - SRAM-DRAM Lesender Speicherzugriff (2) 2.a Hauptspeicher liest Adresse A vom Speicherbus 2.b Hauptspeicher ruft das Wort x unter der Adresse A ab 2.c Hauptspeicher legt das Wort x auf den Bus register file Load operation: movl A, %eax %eax ALU bus interface I/O bridge main memory x 0 x A Norman Hendrich 8

19 Die Speicherhierarchie - SRAM-DRAM Lesender Speicherzugriff (3) 3.a CPU liest Wort x vom Bus 3.b CPU kopiert Wert x in Register %eax register file Load operation: movl A, %eax %eax x ALU I/O bridge main memory 0 bus interface x A Norman Hendrich 9

20 Die Speicherhierarchie - SRAM-DRAM Schreibender Speicherzugriff (+2) CPU legt die Adresse A auf den Bus 2.b Hauptspeicher liest Adresse 2.c Hauptspeicher wartet auf Ankunft des Datenworts register file Store operation: movl %eax, A %eax y ALU bus interface I/O bridge A main memory 0 A Norman Hendrich 20

21 Die Speicherhierarchie - SRAM-DRAM Schreibender Speicherzugriff (3) 3. CPU legt Datenwort y auf den BusA register file Store operation: movl %eax, A %eax y ALU bus interface I/O bridge y main memory 0 A Norman Hendrich 2

22 Die Speicherhierarchie - SRAM-DRAM Schreibender Speicherzugriff (4) 4.a Hauptspeicher liest Datenwort y vom Bus 4.b Hauptspeicher speichert Datenwort y unter Adresse A register file Store operation: movl %eax, A %eax y ALU I/O bridge main memory 0 bus interface y A Norman Hendrich 22

23 Die Speicherhierarchie - SRAM-DRAM DMA: Direct Memory Access beim Transfer größerer Datenmengen: separaten DMA-Controller initialisieren und verwenden autonomer Transfer ohne Beteiligung der CPU CPU via Interrupt benachrichtigt, sobald Transfer komplett Prozess läuft ohne Beteiligung des Prozessors Rechner kann währenddessen andere Programme bearbeiten Norman Hendrich 23

24 Die Speicherhierarchie - Cache Cache Prozessor läuft mit ca. GHz Takt Register können mithalten, aber nur einige kbyte Kapazität DRAM braucht ns für einen Zugriff: 00 langsamer Festplatte braucht 0 ms für einen Zugriff: langsamer aufeinanderfolgende Speicherzugriffe sind meistens lokal Themen Prinzip und Organisation von Cache-Speicher direkt abgebildete Caches ( direct mapped ) bereichsassoziative Caches ( set associative ) Einfluss der Caches auf die Leistung Norman Hendrich 24

25 Die Speicherhierarchie - Cache Verwaltung der Speicherhierarchie Register Memory Compiler Assembler-Programmierer Cache Memory Hardware Memory Disk Hardware und Betriebssystem (Virtual Memory, Paging) Programmierer (Files) Norman Hendrich 25

26 Die Speicherhierarchie - Cache CS420/520 memory.3 UC. Colorado Springs Adapted from UCB97 & UCB03 Speicherhierarchie: Memory Wall Memory Wall : DRAM zu langsam für CPU Who Cares About the Memory Hierarchy? Performance Processor-DRAM Memory Gap (latency) Moore s Law Year µproc 55%/yr. (2X/.5yr) DRAM 7-9%/yr. (2X/0 yrs) Norman Hendrich CS420/ memory.4 UC. Colorado Springs Adapted from UCB97 & UCB CPU Processor-Memory Performance Gap: (grows 50% / year) DRAM

27 Die Speicherhierarchie - Cache Cache: schneller Zwischenspeicher zum Hauptspeicher technische Realisierung: SRAM transparenter Speicher Cache ist für den Programmierer nicht sichtbar! wird durch Hardware verwaltet enthält Hauptspeicherblöcke mit erhöhter Zugriffswahrscheinlichkeit ggf. getrennte Caches für Befehle und Daten basiert auf Prinzip der Lokalität 80% der Zugriffe greifen auf 20% der Adressen zu manchmal auch 90% / 0% oder noch besser Norman Hendrich 27

28 Die Speicherhierarchie - Cache Cache: Funktionsprinzip CPU referenziert Adresse parallele Suche in L (level ), L2... und Hauptspeicher erfolgreiche Suche liefert Datum, Abbruch laufender Suchen CPU chip register file L ALU cache cache bus system bus memory bus L2 cache bus interface I/O bridge main memory Norman Hendrich 28

29 Die Speicherhierarchie - Cache Unified-Cache: gemeinsam für Befehle und Daten Norman Hendrich 29

30 Die Speicherhierarchie - Cache Separate Instruction-/Data-Caches Norman Hendrich 30

31 Die Speicherhierarchie - Cache Cache: Strategie Welche Daten sollen in den Cache? diejenigen, die bald wieder benötigt werden! temporale Lokalität: die Daten, die zuletzt häufig gebraucht wurden räumliche Lokalität: die Daten, die nahe den zuletzt gebrauchten liegen verschiedene Platzierungs-, Ersetzungs- und Rückschreibestategien für den Cache Norman Hendrich 3

32 Die Speicherhierarchie - Cache Cache: Performance Begriffe Treffer (Hit) Zugriff auf Datum, ist bereits im Cache Fehler (Miss) Zugriff auf Datum, ist nicht Treffer-Rate R Hit Wahrscheinlichkeit, Datum ist im Cache Fehler-Rate R Miss R Hit Hit-Time T Hit Zeit, bis Datum bei Treffer geliefert wird Miss-Penalty T Miss zusätzlich benötigte Zeit bei Fehler Mittlere Speicherzugriffszeit = T Hit + R Miss T Miss Beispiel T Hit = Takt, T Miss = 20 Takte, R Miss = 5 % Mittlere Speicherzugriffszeit = 2 Takte Norman Hendrich 32

33 Die Speicherhierarchie - Cache Cache: Organisation Cache ist ein Array von Speicher-Bereichen ( sets ) jeder Bereich enthält eine oder mehrere Zeilen ( lines ) jede Zeile enthält einen Datenblock ( blocks ) jeder Block enthält mehrere Bytes valid bit t tag bits per line per line B = 2 b bytes per cache block set 0: valid valid tag tag 0 0 B B E lines per set valid tag 0 B S = 2 s sets set : valid tag 0 B valid tag 0 B set S-: valid tag 0 B Cache size: C = B x E x S data bytes Norman Hendrich 33

34 Die Speicherhierarchie - Cache Cache: Tags und Daten valid bit per line t tag bits per line B = 2 b bytes per cache block set 0: valid valid tag tag 0 0 B B E lines per set valid tag 0 B S = 2 s sets set : valid tag 0 B valid tag 0 B set S-: valid tag 0 B Norman Hendrich 34

35 Die Speicherhierarchie - Cache Cache: Adressierung und Zugriff Adressteil set index von A bestimmt Bereich ( set ) Adresse A ist im Cache, wenn. Cache-Zeile ist als gültig markiert ( valid ) 2. Adressteil tag von A = tag Bits des Bereichs Address A: t bits s bits b bits set 0: v v tag tag 0 0 B B m- <tag> <set index> <block offset> 0 set : v v tag tag 0 0 B B set S-: v v tag tag 0 0 B B Norman Hendrich 35

36 Die Speicherhierarchie - Cache Cache: Zugriff Cache-Zeile ( cache line ) enthält Datenbereich von 2 b Byte gesuchtes Wort mit Offset block offset Address A: t bits s bits b bits set 0: v v tag tag 0 0 B B m- <tag> <set index> <block offset> 0 set : v v tag tag 0 0 B B set S-: v v tag tag 0 0 B B Norman Hendrich 36

37 Die Speicherhierarchie - Cache Cache: Organisation welchen Platz im Cache belegt ein Datum des Hauptspeichers? drei Möglichkeiten: direkt abgebildet / direct mapped jeder Speicheradresse ist genau eine Cache-Speicherzelle zugeordnet n-fach bereichsassoziativ / set associative jeder Speicheradresse ist eine von n möglichen Cache-Speicherzellen zugeordnet voll-assoziativ jeder Speicheradresse kann jede beliebige Cache-Speicherzelle zugeordnet werden Norman Hendrich 37

38 Die Speicherhierarchie - Cache Cache: direkt abgebildet / direct mapped jeder Adresse ist genau eine Speicherzelle im Cache zugeordnet Cache Memory Norman Hendrich 38

39 Die Speicherhierarchie - Cache Cache: direkt abgebildet / direct mapped eindeutige Zuordnung von Zeilen zu Adressen Wert im tag entspricht genau einer Adresse set 0: valid tag cache block E= lines per set set : valid tag cache block set S-: valid tag cache block die einfachste Cache-Art große Caches realisierbar Thrashing möglich, z.b. Zugriffe auf A, A + n S... Norman Hendrich 39

40 Die Speicherhierarchie - Cache Direct mapped cache: Zugriff Bereichsauswahl durch Bits set index set 0: valid tag cache block selected set set : valid tag cache block m- t bits tag s bits b bits set index block offset set S-: valid tag cache block Norman Hendrich 40

41 Die Speicherhierarchie - Cache Direct mapped cache: Zugriff 2 Test auf valid: sind die Daten gültig? 3 Line matching : stimmt tag überein? 4 Wortselektion extrahiert Wort unter Offset block offset =? () The valid bit must be set selected set (i): w 0 w w 2 w 3 (2) The tag bits in the cache line must match the tag bits in the address m- =? t bits 00 tag s bits b bits i 00 0 set index block offset (3) If () and (2), then cache hit, and block offset selects starting byte. Norman Hendrich 4

42 Die Speicherhierarchie - Cache Direct mapped cache: Prinzip Norman Hendrich 42

43 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 ir A A r pc A load add r5,r2,r3 load r3,4(r) load r2,8(r) A A A s7 s6 s5 s4 s3 s2 s s0 v tags b=3 b=2 b= b= C abcd cafe babe beef aaaa Norman Hendrich 43

44 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 ir A A r pc A load add r5,r2,r3 load r3,4(r) load r2,8(r) A A A s7 s6 s5 s4 s3 s2 s s0 v tags b=3 b=2 b= b= C abcd cafe babe load r2, 8(r) a: fetch cache miss (empty, all invalid) beef aaaa Norman Hendrich 44

45 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 ir A A r pc A load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) A A A s7 s6 s5 s4 s3 s2 s s0 A * load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) v tags b=3 b=2 b= b= C abcd cafe babe load r2, 8(r) a: fetch fill cache set s0 from memory beef aaaa Norman Hendrich 45

46 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 ir load r2,8(r) A A r pc A load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) A A A s7 s6 s5 s4 s3 s2 s s0 v A * tags load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) b=3 b=2 b= b= C abcd cafe babe load r2, 8(r) a: fetch load instruction into ir beef aaaa Norman Hendrich 46

47 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 ir load r2,8(r) A A r pc A load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) A A A s7 s6 s5 s4 s3 s2 s s0 v A * tags load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) b=3 b=2 b= b=0 c c C abcd cafe babe load r2, 8(r) a: fetch b: execute load instruction into ir cache miss beef aaaa Norman Hendrich 47

48 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 ir load r2,8(r) A A r pc A load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) A A A s7 s6 s5 s4 s3 s2 s s0 v * A * tags C load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) b=3 b=2 b= b=0 c c C abcd cafe babe load r2, 8(r) a: fetch b: execute load instruction into ir fill cache set s4 from memory beef aaaa Norman Hendrich 48

49 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 ir load r2,8(r) A A r pc A load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) A A A s7 s6 s5 s4 s3 s2 s s0 v * A * tags C load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) b=3 b=2 b= b=0 c c C abcd cafe babe load r2, 8(r) a: fetch b: execute load instruction into ir load value into r2 beef aaaa Norman Hendrich 49

50 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 ir load r3,4(r) A A r pc A load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) A A A s7 s6 s5 s4 s3 s2 s s * C A * load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) v tags b=3 b=2 b= b=0 c c C abcd cafe babe load r3, 4(r) 2a: fetch cache hit beef aaaa Norman Hendrich 50

51 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 ir load r3,4(r) A r pc A load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) A A A A s7 s6 s5 s4 s3 s2 s s * C A * load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) v tags b=3 b=2 b= b=0 c c C abcd cafe babe load r3, 4(r) 2a: fetch cache hit 2b: execute cache hit beef aaaa Norman Hendrich 5

52 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 ir add r5,r2,r3 A r pc A load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) A A A A s7 s6 s5 s4 s3 s2 s s * C A * load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) v tags b=3 b=2 b= b=0 c c C abcd cafe babe add r5,r2,r3 3a: fetch cache hit beef aaaa Norman Hendrich 52

53 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 r C ir pc add r5,r2,r3 A load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) A A A A A s7 s6 s5 s4 s3 s2 s s * C A * load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) v tags b=3 b=2 b= b=0 c c C abcd cafe babe add r5,r2,r3 3a: fetch 3b: execute cache hit no memory access beef aaaa Norman Hendrich 53

54 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 r C ir pc load r6,-4(r) A C load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) A A A A A s7 s6 s5 s4 s3 s2 s s0 v * A * tags C load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) b=3 b=2 b= b=0 c c C abcd cafe babe load r6,-4(r) 4a: fetch cache hit beef aaaa Norman Hendrich 54

55 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 r0 ir load r6,-4(r) C pc A C load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) A A A A A C... s7 s6 s5 s4 s3 s2 s s * C A * load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) v tags b=3 b=2 b= b=0 c c C abcd cafe babe load r6,-4(r) 4a: fetch cache hit 4b: execute cache miss beef aaaa Norman Hendrich 55

56 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 r C ir pc load r6,-4(r) A C load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) A A A A A C... s7 s6 s5 s4 s3 s2 s s0 v * * A * tags C load r6,-4(r) 5678 abcd cafe babe add r5,r2,r3 load r3,4(r) load r2,8(r) b=3 b=2 b= b=0 c c C abcd cafe babe load r6,-4(r) 4a: fetch cache hit 4b: execute cache miss beef aaaa Norman Hendrich 56

57 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 r C ir pc load r6,-4(r) A C load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) A A A A A C... s7 s6 s5 s4 s3 s2 s s0 v * * A * tags C load r6,-4(r) 5678 abcd cafe babe add r5,r2,r3 load r3,4(r) load r2,8(r) b=3 b=2 b= b=0 c c C abcd cafe babe load r6,-4(r) 4a: fetch cache hit 4b: execute cache miss, fill cache s3, load r6 beef aaaa Norman Hendrich 57

58 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 r C ir pc A add r7,r2,r6 load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) A A A A A s7 s6 s5 s4 s3 s2 s s * C * abcd cafe babe A000 00* add r7,r2,r6 A * load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) v tags b=3 b=2 b= b=0 c c C abcd cafe babe add r7,r2,r6 5a: fetch cache miss beef aaaa Norman Hendrich 58

59 Die Speicherhierarchie - Cache Direct mapped cache: Beispiel... r7 r C ir pc add r7,r2,r6 A add r7,r2,r6 load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) A A A A A s7 s6 s5 s4 s3 s2 s s * C * abcd cafe babe A000 00* add r7,r2,r6 A * load r6,-4(r) add r5,r2,r3 load r3,4(r) load r2,8(r) v tags b=3 b=2 b= b=0 c c C abcd cafe babe add r7,r2,r6 5a: fetch cache miss fill cache line, load ir beef aaaa Norman Hendrich 59

60 Die Speicherhierarchie - Cache Cache: bereichsassoziativ / set associative jeder Speicheradresse ist ein Bereich S mit mehreren (E) Cachezeilen zugeordnet n-fach assoziative Caches: E=2, way set associative cache, 4-way... set 0: valid tag cache block valid tag cache block E=2 lines per set set : set S-: valid tag cache block valid tag cache block valid tag cache block valid tag cache block Norman Hendrich 60

61 Die Speicherhierarchie - Cache Zugriff auf n-fach assoziative Caches Bereichsauswahl durch Bits set index set 0: valid valid tag tag cache block cache block Selected set set : valid valid tag tag cache block cache block m- t bits tag s bits b bits set index block offset set S-: valid valid tag tag cache block cache block Norman Hendrich 6

62 Die Speicherhierarchie - Cache Zugriff auf n-fach assoziative Caches 2 valid : sind die Daten gültig? 3 Line matching : Cache-Zeile mit passendem tag finden? dazu Vergleich aller tags des Bereichs set index 4 Wortselektion extrahiert Wort unter Offset block offset =? () The valid bit must be set selected set (i): w 0 w w 2 w 3 (2) The tag bits in one of the cache lines must match the tag bits in the address m- =? t bits 00 tag s bits b bits i 00 0 set index block offset (3) If () and (2), then cache hit, and block offset selects starting byte. Norman Hendrich 62

63 Die Speicherhierarchie - Cache 2-fach set-associative Cache: Prinzip Norman Hendrich 63

64 Die Speicherhierarchie - Cache Cache: voll-assoziativ jeder Adresse des Speichers kann jede beliebige Cachezeile zugeordnet werden, theoretisch beste Performance also Spezialfall: nur ein Cachebereich S =, aber E = Anzahl der Lines + besonders flexibel: Speicherung an allen Adressen im Cache benötigt E-Vergleicher derzeit nur für sehr kleine Caches realisierbar in der Praxis selten verwendet Norman Hendrich 64

65 Die Speicherhierarchie - Cache Cache: Dimensionierung Address A: t bits s bits b bits set 0: v v tag tag 0 0 B B m- <tag> <set index> <block offset> 0 set : v v tag tag 0 0 B B set S-: v v tag tag 0 0 B B Parameter: S, B, E Norman Hendrich 65

66 Die Speicherhierarchie - Cache Cache: Dimensionierung Blöcke mit mehreren Datenworten / Cache-Line Wortauswahl durch block offset in Adresse + nutzt räumliche Lokalität aus + Breite externe Datenbusse + nutzt Burst-Adressierung des Speichers: Adresse nur für erstes Wort vorgeben, dann automatisches Inkrement + kürzere interne Cache-Adressen Norman Hendrich 66

67 Die Speicherhierarchie - Cache Cache- und Block-Dimensionierung Blockgröße klein, viele Blöcke + kleinere Miss-Penalty + temporale Lokalität räumliche Lokalität Blockgröße groß, wenig Blöcke größere Miss-Penalty temporale Lokalität + räumliche Lokalität Norman Hendrich 67

68 Die Speicherhierarchie - Cache Cache- und Block-Dimensionierung 25% 20% k 4k 6k 64k 256k Miss rate 5% 0% 5% 0% Block size Block-Size: Byte L-Cache: kb L2-Cache: kb Norman Hendrich 68

69 Die Speicherhierarchie - Cache Cache: Dimensionierung, Relative Performance Furber, Arm SoC Architecture Norman Hendrich 69

70 Die Speicherhierarchie - Cache Drei Typen von Cache-Misses cold miss Cache ist (noch) leer conflict miss: wenn die Kapazität des Cache eigentlich ausreicht, aber unterschiedliche Daten in den selben Block abgebildet werden Beispiel für Trashing beim direct-mapped Cache mit S=8: abwechselnder Zugriff auf Blöcke 0, 8, 0, 8, 0, 8,... ist jedesmal ein Miss capacity miss: wenn die Menge der aktiven Blöcke ( working set ) größer ist als die Kapazität des Cache Norman Hendrich 70

71 Die Speicherhierarchie - Cache Cache: Ersetzungsstrategie Wenn der Cache gefüllt ist, welches Datum wird entfernt? zufällige Auswahl LRU least recently used : der älteste nicht benutzte Cache Eintrag echtes LRU als Warteschlange realisiert Pseudo LRU mit baumartiger Verwaltungsstruktur: Zugriff wird paarweise mit einem Bit markiert, die Paare wieder zusammengefasst usw. LFU least frequently used : der am seltensten benutzte Cache Eintrag durch Zugriffszähler implementiert Norman Hendrich 7

72 Die Speicherhierarchie - Cache Cache: Schreibstrategie Wann werden modifizierte Daten des Cache zurückgeschrieben? Write-Through: beim Schreiben werden Daten sofort im Cache und im Hauptspeicher modifiziert andere Bus-Master sehen immer den richtigen Speicherinhalt: Cache-Kohärenz Werte werden unnötig oft in Speicher zurückgeschrieben Write-Back: erst in den Speicher schreiben, wenn Datum des Cache ersetzt werden würde häufig genutzte Werte (z.b. lokale Variablen) werden nur im Cache modifiziert Cache-Kohärenz ist nicht gegeben spezielle Befehle für Cache-Flush non-cacheable Speicherbereiche Norman Hendrich 72

73 Die Speicherhierarchie - Cache Cache: Kohärenz Daten zwischen Cache und Speicher konsistent halten notwendig wenn auch andere Einheiten (Bus-Master) auf Speicher zugreifen können (oder Mehrprozessorsysteme!) Harvard-Architektur hat getrennte Daten- und Instruktions-Speicher: einfacherer Instruktions-Cache Instruktionen sind read-only kein Cache-Kohärenz Problem Snooping Cache lauscht am Speicherbus externer Schreibzugriff Cache aktualisieren / ungültig machen externer Lesezugriff Cache liefert Daten MESI-Protokoll: nächste Woche Norman Hendrich 73

74 Die Speicherhierarchie - Cache Cache: Performance Mittlere Speicherzugriffszeit = T Hit + R Miss T Miss Verbesserung der Cache Performanz durch kleinere T Miss am einfachsten zu realisieren mehrere Cache Ebenen Critical Word First: bei großen Cache Blöcken (mehrere Worte) gefordertes Wort zuerst holen und gleich weiterleiten Read-Miss hat Priorität gegenüber Write-Miss Zwischenspeicher für Schreiboperationen (Write Buffer) Merging Write Buffer: aufeinanderfolgende Schreiboperationen zwischenspeichern und zusammenfassen Victim Cache: kleiner voll-assoziativer Cache zwischen direct-mapped Cache und nächster Ebene sammelt verdrängte Cache Einträge Norman Hendrich 74

75 Die Speicherhierarchie - Cache Cache: Performance Verbesserung der Cache Performanz durch kleinere R Miss größere Caches ( mehr Hardware) höhere Assoziativität ( langsamer) Optimierungstechniken Software Optimierungen Prefetch: Hardware (Stream Buffer) Software (Prefetch Operationen) Cache Zugriffe in Pipeline verarbeiten Trace Cache: im Instruktions-Cache werden keine Speicherinhalte, sondern ausgeführte Sequenzen (trace) einschließlich ausgeführter Sprünge gespeichert Norman Hendrich 75

76 Die Speicherhierarchie - Cache Cache: Matrix-Beispiel aus Teil public static double sumrowcol( double[][] matrix ) { int rows = matrix.length; int cols = matrix[0].length; double sum = 0.0; for( int r = 0; r < rows; r++ ) { for( int c = 0; c < cols; c++ ) { sum += matrix[r][c]; } } return sum; } Matrix (5000,5000) creation took 205 msec. Matrix row-col summation took 75 msec. Matrix col-row summation took 383 msec. Sum is (5x langsamer) (andere Werte) Norman Hendrich 76

77 Die Speicherhierarchie - Cache Cache: Beispiel Matrix-Multiplikation Norman Hendrich 77

78 Die Speicherhierarchie - Cache Cache: Beispiel Matrix-Multiplikation Norman Hendrich 78

79 Die Speicherhierarchie - Cache Cache: Beispiel Matrix-Multiplikation Norman Hendrich 79

80 Die Speicherhierarchie - Cache Cache: Beispiel Matrix-Multiplikation Norman Hendrich 80

81 Die Speicherhierarchie - Cache Cache: Memory Mountain Norman Hendrich 8

82 Die Speicherhierarchie - Cache Cache: Memory Mountain Transferrate in MB/s vs. Blockgröße und Stride Beispiel-PC: 7 GB/s max., 200 MB/s sustained: Faktor 35 Norman Hendrich 82

83 Die Speicherhierarchie - Cache Chiplayout: Intel Core-i Prozessoren Nehalem Norman Hendrich 83

84 Die Speicherhierarchie - Cache Cache vs. Programmcode Programmierer kann für maximale Cacheleistung optimieren Datenstrukturen werden fortlaufend alloziert. durch entsprechende Organisation der Datenstrukturen 2. durch Steuerung des Zugriffs auf die Daten Geschachtelte Schleifenstruktur Blockbildung ist eine übliche Technik Systeme bevorzugen einen Cache-freundlichen Code Erreichen der optimalen Leistung ist plattformspezifisch Cachegrößen, Zeilengrößen, Assoziativität etc. generelle Empfehlungen working set klein zeitliche Lokalität kleine Adressfortschaltungen ( strides ) räumliche Lokalität Norman Hendrich 84

85 Die Speicherhierarchie - Virtueller Speicher Virtueller Speicher: Motivation Wunsch des Programmierers möglichst großer Adressraum, ideal 2 32 Byte oder größer linear adressierbar Sicht des Betriebssystems verwaltet eine Menge laufender Tasks / Prozesse jedem Prozess steht nur begrenzter Speicher zur Verfügung strikte Trennung paralleler Prozesse Sicherheitsmechanismen und Zugriffsrechte read-only Bereiche für Code read-write Bereiche für Daten widersprüchliche Anforderungen Lösung mit virtuellem Speicher und Paging Norman Hendrich 85

86 Die Speicherhierarchie - Virtueller Speicher Virtueller Speicher: Idee. Benutzung der Festplatte als erweiterten Hauptspeicher Prozessadressraum kann physikalische Speichergröße übersteigen Summe der Adressräume mehrerer Prozesse kann physikalischen Speicher übersteigen 2. Unterstützung mehrerer Prozesse mehrere Prozesse gleichzeitig im Hauptspeicher jeder Prozess hat seinen eigenen Adressraum (0... n) nur aktiver Code und Daten sind tatsächlich im Speicher bedarfsabhängige, dynamische Speicherzuteilung 3. Bereitstellung von Schutzmechanismen ein Prozess kann einen anderen nicht beeinflussen Benutzerprozess hat keinen Zugriff auf privilegierte Informationen jeder virtuelle Adressraum hat eigene Zugriffsrechte Norman Hendrich 86

87 Die Speicherhierarchie - Virtueller Speicher Ebenen in der Speicherhierarchie cache virtual memory CPU regs C 6 B a 64 B 4 KB Memory c h e disk size: speed: $/Mbyte: line size: Register Cache Memory Disk Memory 64 B 300 ps 6 B 32 KB-2MB ns 5 /MB 64 B 8 GB 8 ns 5 /GB 4 KB 2 TB 4 ms 4 Ct./GB larger, slower, cheaper Norman Hendrich 87

88 Die Speicherhierarchie - Virtueller Speicher Festplatte erweitert Hauptspeicher MB: ~ 5 SRAM GB: ~5 DRAM TB: ~40 Disk Adressraum sehr groß nur teilweise als DRAM realisiert 32-bit Adressen: Byte 64-bit Adressen: Byte Speichern auf Festplatte ist 25 billiger als im DRAM TB DRAM: TB Festplatte: 40 kostengünstiger Zugriff auf große Datenmengen Norman Hendrich 88

89 Die Speicherhierarchie - Virtueller Speicher Festplatte als Hauptspeicher: Zugriffszeiten SRAM DRAM Disk Zugriff auf Daten auf der Festplatte ist langsam Unterschied DRAM vs. Festplatte ist extremer als SRAM vs. DRAM DRAM 0 langsamer als SRAM Festplatte langsamer als DRAM Nutzung der räumlichen Lokalität wichtig erstes Byte langsamer als nachfolgende Bytes Norman Hendrich 89

90 Die Speicherhierarchie - Virtueller Speicher System ohne/mit virtuellem Speicher System mit rein physikalischem Speicher (SRAM oder DRAM) Programme addressieren den Speicher direkt fast alle Microcontroller frühe PCs (DOS) Cray Supercomputer System mit MMU und virtuellem Speicher (DRAM plus Festplatte) Memory-Management-Unit Programme addressieren den Speicher virtuell virtuelle Adressen werden von der MMU über eine Seiten-Tabelle umgesetzt Workstations, moderne PCs Norman Hendrich 90

91 Die Speicherhierarchie - Virtueller Speicher Prinzip des virtuellen Speichers jeder Prozess bekommt seinen eigenen virtuellen Adressraum Kombination aus Betriebssystem und Hardwareeinheiten Umsetzung von virtuellen zu physikalischen Adressen Umsetzungstabellen werden vom Betriebssystem verwaltet wegen des Speicherbedarfs der Tabellen beziehen sich diese auf größere Speicherblöcke: Seiten Umgesetzt wird nur die Anfangsadresse der Seite, der Offset innerhalb des Blocks bleibt unverändert Blöcke des virtuellen Adressraums können durch das Betriebssystem auf Festplatte ausgelagert werden Windows: Auslagerungsdatei Unix/Linux: swap Partition und -Datei(en) Norman Hendrich 9

92 Die Speicherhierarchie - Virtueller Speicher Virtueller Speicher: Paging / Seitenadressierung Unterteilung des Adressraums in Blöcke fester Größe = Seiten Abbildung auf Hauptspeicherblöcke = Kacheln Memory Virtual Addresses Page Table 0: : Physical Addresses 0: : CPU P-: N-: Disk Norman Hendrich 92

93 Die Speicherhierarchie - Virtueller Speicher Paging / Seitenadressierung: Vorteile Abbildung der Adressen in den virtuellen Speicher Programme/Daten können größer als der Hauptspeicher sein Programme können an beliebige physikalischen Adressen geladen werden, unabhängig von der Aufteilung des physikalischen Speichers feste Seitengröße: effiziente Umsetzung in Hardware Zugriffsrechte für jede Seite (read/write, User/Supervisor) gemeinsam genutzte Programmteile/-Bibliotheken können sehr einfach in das Konzept integriert werden Windows:.dll-Dateien Unix/Linux:.so-Dateien Norman Hendrich 93

94 Die Speicherhierarchie - Virtueller Speicher Paging / Seitenadressierung: Nachteile große Miss-Penalty beim Zugriff auf ausgelagerte Seiten Zeitbedarf für das Nachladen von der Platte Seiten sollten relativ groß sein: kb Speicherplatzbedarf der Seitentabelle abhängig vom Adressraum und Seitengröße ab 32-bit Adressraum sehr große Tabellen mehrstufige Tabellen Hash-Verfahren (inverted page tables) Kombinationen davon Norman Hendrich 94

95 Die Speicherhierarchie - Virtueller Speicher Seitenfehler Seiten-Tabelleneintrag: Startadresse der virt. Seite auf Platte Daten von Festplatte in Speicher laden: Aufruf des Exception handler des Betriebssystems laufender Prozess wird unterbrochen, andere können weiterlaufen Betriebssystem kontrolliert die Platzierung der neuen Seite im Hauptspeicher (Ersetzungsstrategien) etc. Virtual Addresses CPU Page Table Physical Addresses Memory Virtual Addresses CPU Page Table Physical Addresses Memory Disk Disk Norman Hendrich 95

96 Die Speicherhierarchie - Virtueller Speicher Seitenfehler (cont.) Behandlung des Seitenfehlers. Prozessor signalisiert DMA-Controller lies Block der Länge P ab Festplattenadresse X speichere Daten ab Adresse Y in Hauptspeicher 2. Lesezugriff erfolgt als Direct Memory Access (DMA) Kontrolle durch I/O Controller 3. I/O Controller meldet Abschluss Gibt Interrupt an den Prozessor Betriebssystem lässt unterbrochenen Prozess weiterlaufen Processor Reg Cache Memory Memory-I/O bus (2) DMA Transfer Disk () Initiate Block Read (3) Read Done I/O controller Disk Norman Hendrich 96

97 Die Speicherhierarchie - Virtueller Speicher Separate virtuelle Adressräume Mehrere Prozesse können im physikalischen Speicher liegen Wie werden Adresskonflikte gelöst? Was passiert, wenn Prozesse auf dieselbe Adresse zugreifen? %esp kernel virtual memory stack memory invisible to user code Linux x86 Speicherorganisation Memory mapped region forshared libraries runtime heap (via malloc) the brk ptr uninitialized data (.bss) initialized data (.data) program text (.text) forbidden 0 Norman Hendrich 97

98 Die Speicherhierarchie - Virtueller Speicher Separate virtuelle Adressräume (cont.) Auflösung der Adresskonflikte jeder Prozess hat seinen eigenen virtuellen Adressraum Betriebssystem kontrolliert wie virtuelle Seiten auf den physikalischen Speicher abgebildet werden Virtual Address Space for Process : Virtual Address Space for Process 2: 0 N- 0 N- VP VP 2... VP VP 2... Address Translation 0 M- PP 2 PP 7 PP 0 Physical Address Space (DRAM) (e.g., read/only library code) Norman Hendrich 98

99 Die Speicherhierarchie - Virtueller Speicher Virtueller Speicher: Adressumsetzung Parameter P = 2 p = Seitengröße (Bytes) N = 2 n = Limit der virtuellen Adresse M = 2 m = Limit der physikalischen Adresse n p p 0 virtual page number page offset virtual address address translation m p p 0 physical page number page offset physical address Norman Hendrich 99

100 Die Speicherhierarchie - Virtueller Speicher Virtueller Speicher: Adressumsetzung Virtueller Adressraum V = {0,,..., N-} Physikalischer Adresssraum P = {0,,..., M-} meistens M<N Adressumsetzung MAP: V P { } Für eine virtuelle Adresse a: MAP(a) = a, wenn Daten bei virtueller Adresse a und physikalischer Adresse a in P sind MAP(a) =, wenn Daten bei virtueller Adresse a nicht im physikalischen Speicher sind, d. h. entweder ungültig oder nur auf Festplatte gespeichert sind. Realisierung von MAP mit einer Seiten-Tabelle Norman Hendrich 00

101 Die Speicherhierarchie - Virtueller Speicher Virtueller Speicher: Hit Processor a Hardware Addr Trans Mechanism a' Main Memory virtual address part of the physical address on-chip memory mgmt unit (MMU) Programm greift auf virtuelle Adresse a zu MMU überprüft den Zugriff, liefert physikalische Adresse a Speicher liefert die zugehörigen Daten d[a ] Norman Hendrich 0

102 Die Speicherhierarchie - Virtueller Speicher Virtueller Speicher: Miss Processor a virtual address Hardware Addr Trans Mechanism a' page fault fault handler Main Memory part of the physical address on-chip memory mgmt unit (MMU) Secondary memory OS performs this transfer (only if miss) Programm greift auf virtuelle Adresse a zu MMU überprüft den Zugriff, Adresse nicht in MAP page-fault ausgelöst, Betriebssystem übernimmt Norman Hendrich 02

103 Die Speicherhierarchie - Virtueller Speicher Seiten-Tabelle: Konzept Virtual Page Number Memory resident page table (physical page or disk address) Valid Physical Memory Disk Storage (swap file or regular file system file) Norman Hendrich 03

104 Die Speicherhierarchie - Virtueller Speicher Seiten-Tabelle: Details page table base register VPN acts as table index virtual address n p p 0 virtual page number (VPN) page offset valid access physical page number (PPN) if valid=0 then page not in memory m p p physical page number (PPN) page offset physical address 0 Norman Hendrich 04

105 Die Speicherhierarchie - Virtueller Speicher Adressumsetzung mit Seiten-Tabelle virtual page number VPN zeigt auf Seiten-Tabelleneintrag Seiten-Tabelleneintrag liefert Informationen über die Seite valid-bit = : die Seite ist im Speicher benutze physikalische Seitennummer ( Physical Page Number ) zur Adressberechnung valid-bit = 0: die Seite ist auf der Festplatte Seitenfehler je eine Seitentabelle für jeden Prozess page table base register VPN acts as table index virtual address n p p 0 virtual page number (VPN) page offset valid access physical page number (PPN) if valid=0 then page not in memory m p p physical page number (PPN) page offset physical address 0 Norman Hendrich 05

106 Die Speicherhierarchie - Virtueller Speicher Separate Seiten-Tabelle für jeden Prozess je eine Seitentabelle für jeden Prozess spezielles Register ( page table base register ) in der MMU Adresse der Seitentabelle des aktiven Prozesses wird vom Betriebssystem beim Prozesswechsel gesetzt page table base register VPN acts as table index virtual address n p p 0 virtual page number (VPN) page offset valid access physical page number (PPN) if valid=0 then page not in memory m p p physical page number (PPN) page offset physical address 0 Norman Hendrich 06

107 Die Speicherhierarchie - Virtueller Speicher Verwaltung von Zugriffsrechten Schutzüberprüfung zusätzliche Einträge (bits) in der Seitentabelle typischerweise werden zahlreiche Schutzmodi unterstützt Unterscheidung zwischen Kernel- und User-Mode z.b. read-only, read-write, execute-only, no-execute no-execution Bits gesetzt für Stack-Pages: Erschwerung von Buffer-Overflow-Exploits Schutzrechteverletzung wenn Prozess/Benutzer nicht die nötigen Rechte hat bei Verstoß erzwingt die Hardware den Schutz durch das Betriebssystem ( Trap / Exception ) Norman Hendrich 07

108 Die Speicherhierarchie - Virtueller Speicher Zugriffsrechte: Read/Write-Bits in der Seiten-Tabelle Process i: VP 0: VP : VP 2: Page Tables Read? Write? Yes Yes No No Yes No Physical Addr PP 9 PP 4 XXXXXXX 0: : Memory Process j: Read? Write? VP 0: Yes Yes VP : Yes No VP 2: No No Physical Addr PP 6 PP 9 XXXXXXX N-: Norman Hendrich 08

109 Die Speicherhierarchie - Virtueller Speicher Integration von virtuellem Speicher und Cache CPU VA PA miss Translation Cache data hit Main Memory Die meisten Caches werden physikalisch adressiert Zugriff über physikalische Adressen mehrere Prozesse können gleichzeitig Blöcke im Cache haben mehrere Prozesse können sich Seiten teilen Cache muss sich nicht mit Schutzproblemen befassen Zugriffsrechte werden als Teil der Adressumsetzung überprüft Die Adressumsetzung wird vor dem Cache Lookup durchgeführt kann selbst Speicherzugriff (auf den PTE) beinhalten Seiten-Tabelleneinträge können auch gecacht werden Norman Hendrich 09

110 Die Speicherhierarchie - Virtueller Speicher TLB / Translation Lookaside Buffer Beschleunigung der Adressumsetzung für virtuellen Speicher kleiner Hardware Cache in MMU (Memory Management Unit) bildet virtuelle Seitenzahlen auf physikalische ab enthält komplette Seiten-Tabelleneinträge für wenige Seiten CPU hit VA PA miss TLB Lookup Cache Main Memory miss hit Translation data Norman Hendrich 0

111 Die Speicherhierarchie - Virtueller Speicher TLB / Translation Lookaside Buffer (cont.) n p p 0 virtual page number page offset virtual address valid tag physical page number... TLB TLB hit = physical address tag index valid tag data byte offset Cache cache hit = data Norman Hendrich

112 Die Speicherhierarchie - Virtueller Speicher Beispiel für einfaches Speichersystem Adressierung 4-Bit virtuelle Adresse 2-Bit physikalische Adresse Seitengröße = 64 Bytes Norman Hendrich 2

113 Die Speicherhierarchie - Virtueller Speicher Einfaches Speichersystem: Seiten-Tabelle Nur die ersten 6 Einträge werden gezeigt Norman Hendrich 3

114 Die Speicherhierarchie - Virtueller Speicher Einfaches Speichersystem: TLB 6 Einträge 4-fach assoziativ Norman Hendrich 4

115 Die Speicherhierarchie - Virtueller Speicher Einfaches Speichersystem: Cache 6 Zeilen 4-byte pro Zeile (line size) Direkt abgebildet CT CI CO PPN PPO Idx Tag Valid B0 B B2 B3 Idx Tag Valid B0 B B2 B A D 0 2 B A 2D 93 5 DA 3B B 0B D 8F 09 C D F0 D D E B D3 7 6 C2 DF 03 F 4 0 Norman Hendrich 5

116 Die Speicherhierarchie - Virtueller Speicher Adressumsetzungsbeispiel Nr. Norman Hendrich 6

117 Die Speicherhierarchie - Virtueller Speicher Adressumsetzungsbeispiel Nr. 2 Norman Hendrich 7

118 Die Speicherhierarchie - Virtueller Speicher Adressumsetzungsbeispiel Nr. 3 Norman Hendrich 8

119 Die Speicherhierarchie - Virtueller Speicher mehrstufige Seiten-Tabellen typische Werte für 32-bit System 4 kb (2 2 ) Seitengröße 32-Bit Adressraum 4-Byte PTE ( Page Table Entry ) Seitentabelleneintrag Problem würde 4 MB Seiten-Tabelle erfordern 2 20 Bytes (pro Prozess) übliche Lösung mehrstufige Seiten-Tabellen ( multi-level ) z.b. zweistufige Tabelle (Pentium P6) Ebene-: 024 Einträge Ebene-2 Tabelle Ebene-2: 024 Einträge Seiten Einträge können auf Festplatte ausgelagert werden Level Table Level 2 Tables... Norman Hendrich 9

120 Die Speicherhierarchie - Virtueller Speicher mehrstufige Seiten-Tabelle Page Directory P=, M= P=, M= P=0, M=0 P=0, M= PT 3 PT 2 PT 0 P=, M= P=0, M=0 P=, M= P=0, M= P=, M= P=0, M=0 P=, M= P=0, M= P=0, M= P=0, M= P=0, M=0 P=0, M=0 Page 5 Page 4 Page 3 Page 2 Page Page 0 Page 9 Page 8 Page 7 Page 6 Page 5 Mem Addr Page 4 Disk Addr Page 3 In Mem Page 2 On Disk Page Unmapped Page 0 Norman Hendrich 20

121 Die Speicherhierarchie - Virtueller Speicher Beispiel: Pentium und Linux 32-bit Adressraum 4 kb Seitengröße L, L2 TLBs 4fach assoziativ Instruktions TLB 32 Einträge 8 Sets Daten TLB 64 Einträge 6 Sets L I-Cache, D-Cache 6 kb 32 B Cacheline 28 Sets L2 Cache Instr.+Daten zusammen 28 kb... 2 MiB DRAM bus interface unit instruction fetch unit processor package external system bus (e.g. PCI) L2 cache L i-cache cache bus inst TLB data TLB L d-cache Norman Hendrich 2

122 Die Speicherhierarchie - Virtueller Speicher Pentium und Linux: Seiten-Tabelle 0 VPN word offset into page directory page directory 0 2 VPN2 VPO word offset into page table page table Virtual address word offset into physical and virtual page PDBR physical address of page directory PDE PTE physical address of page table base (if P=) physical address of page base (if P=) 20 PPN 2 PPO Physical address Norman Hendrich 22

123 Die Speicherhierarchie - Virtueller Speicher Pentium und Linux: TLB und Cache CPU 32 result L2 and DRAM 20 2 VPN VPO 6 4 TLBT TLBI virtual address (VA) L hit L miss TLB miss... TLB hit L (28 sets, 4 lines/set) VPN VPN2 TLB (6 sets, 4 entries/set) 20 2 PPN PPO CT CI CO PDE PTE physical address (PA) PDBR Page tables Norman Hendrich 23

124 Die Speicherhierarchie - Virtueller Speicher Zusammenfassung: Speicherhierarchie Cache Speicher dient nur zur Beschleunigung unsichtbar für Anwendungsprogrammierer und OS komplett in Hardware implementiert Virtueller Speicher Nutzung der Festplatte als erweiterter Hauptspeicher ermöglicht viele Funktionen des Betriebssystems mehrere Prozesse, Schutzmechanismen Implementierung mit Hardware und Software Norman Hendrich 24

125 Die Speicherhierarchie - Virtueller Speicher Zusammenfassung: Virtueller Speicher ermöglicht viele Funktionen des Betriebssystems größerer virtueller Speicher als reales DRAM Auslagerung von Daten auf die Festplatte Prozesse erzeugen ( exec / fork ) Taskwechsel Schutzmechanismen Implementierung mit Hardware und Software Software verwaltet die Tabellen und Zuteilungen Hardwarezugriff auf die Tabellen Hardware-Caching der Einträge (TLB) Norman Hendrich 25

126 Die Speicherhierarchie - Virtueller Speicher Zusammenfassung: Virtueller Speicher Sicht des Programmierers großer flacher Adressraum Programm besitzt die gesamte Maschine hat privaten Adressraum bleibt unberührt vom Verhalten anderer Prozesse Sicht des Systems Adressraum von Prozessen auf Seiten abgebildet muss nicht fortlaufend sein wird dynamisch zugeteilt erzwingt Schutz bei Adressumsetzung Betriebssystem verwaltet viele Prozesse gleichzeitig jederzeit schneller Wechsel zwischen Prozessen u.a. beim Warten auf Ressourcen (Seitenfehler) Norman Hendrich 26

127 Die Speicherhierarchie - Festplatten Festplatten magnetischer Massenspeicher IBM RAMAC 50, 956, 5 MB nichtflüchtige Datenspeicherung hohe Speicherkapazität gutes Preis-Leistungsverhältnis dominierende Technologie langsamer, serieller Zugriff Dateisystemcaching als Abhilfe Kenngrößen Speicherkapazität, z.b. 2 TB Dauertransferrate, z.b. 00 MB/s mittlere Zugriffszeit, z.b. 8 ms MTBF, z.b h Norman Hendrich 27

128 Die Speicherhierarchie - Festplatten Festplatte: Prinzip Ansicht einer Platte Umdrehung mit konstanter Geschwindigkeit spindle Schreib/Lese Kopf ist an Arm befestigt fliegt auf Luftpolster über Plattenoberfläche radiale Bewegung des Arms positioniert Kopf auf Spuren Norman Hendrich 28

129 Die Speicherhierarchie - Festplatten Festplatte: mehrere Schreib/Lese-Köpfe arm Schreib/Lese Köpfe werden gemeinsam auf Zylindern positioniert spindle Kapazität und Kosten proportional zur Anzahl der Platten günstige Festplatten: eine Platte, zwei Köpfe (oben/unten) Norman Hendrich 29

130 Die Speicherhierarchie - Festplatten Festplattengeometrie Platten mit jeweils zwei Oberflächen ( surfaces ) Spuren als konzentrische Ringe auf den Oberflächen ( tracks ), jede Spur unterteil in Sektoren ( sectors ), kurze Lücken ( gaps ) dienen zur Synchronisierung tracks surface track k gaps spindle sectors Norman Hendrich 30

131 Die Speicherhierarchie - Festplatten Festplattengeometrie (Ansicht mehrerer Platten) untereinander liegende Spuren (mehrerer Platten) bilden logisch einen Zylinder : gleiche Zugriffsmuster cylinder k surface 0 surface surface 2 surface 3 surface 4 surface 5 platter 0 platter platter 2 spindle Norman Hendrich 3

132 Die Speicherhierarchie - Festplatten Festplattenkapazität Kapazität: Höchstzahl speicherbarer Bits typische Kapazität ca. TB (hier: TB = 0 2 Byte) (203) technologischen Faktoren Aufnahmedichte [bits/in]: bits pro -inch Segment einer Spur Spurdichte [tracks/in]: Anzahl der Spuren pro -inch Radius Flächendichte [bits/in 2 ]: Produkt aus Aufnahme- und Spurdichte limitiert durch minimal noch detektierbare Magnetisierung sowie durch Positionierungsgenauigkeit der Köpfe Spuren in getrennte Aufnahmezonen ( recording zones ) unterteilt jede Spur einer Zone hat gleichviele Sektoren (festgelegt durch die Ausdehnung der innersten Spur) Zone haben unterschiedlich viele Sektoren/Spuren Norman Hendrich 32

133 Die Speicherhierarchie - Festplatten Berechnen der Festplattenkapazität Kapazität = Bytes/Sektor mittlere Anzahl Sektoren/Spur Spuren/Oberfläche Oberflächen/Platten Platten/Festplatte Beispiel 52 Bytes/Sektor 300 Sektoren/Spuren (im Durchschnitt) Spuren/Oberfläche 2 Oberflächen/Platten 5 Platten/Festplatte Kapazität = = = 30,72 GB uraltes Modell Norman Hendrich 33

134 Die Speicherhierarchie - Festplatten Festplatten-Zugriffszeit Durchschnittliche (avg) Zugriffszeit auf einen Zielsektor wird angenähert durch: T Zugriff = T avgsuche + T avgrotation + T avgtransfer Suchzeit (T avgsuche ) Zeit in der Schreib-Lese-Köpfe ( heads ) über den Zylinder mit dem Zielsektor positioniert werden üblicherweise T avgsuche = 8 ms Norman Hendrich 34

135 Die Speicherhierarchie - Festplatten Festplatten-Zugriffszeit (cont.) Rotationslatenzzeit (T avgrotation ) Wartezeit, bis das erste Bit des Zielsektors unter dem r/w Schreib-Lese-Kopf durchrotiert. T avgrotation = /2 /RPMs 60 Sek/ Min typische Drehzahlen, rotations per minute, sind RPM (desktop.. server) T avgrotation 5.5 ms ms Transferzeit (T avgtransfer ) Zeit, in der die Bits des Zielsektors gelesen werden T avgtransfer = /RPM /(Durchschn # Sektoren/Spur) 60 Sek / Min Norman Hendrich 35

136 Die Speicherhierarchie - Festplatten Beispiel für Festplatten-Zugriffszeit Beispiel: Umdrehungszahl = RPM Durchschnittliche Suchzeit = 9 ms. mittlere Anzahl der Sektoren pro Spur = 400 eingesetzt T avgrotation = /2 (60 s/7200 RPM) 000 ms/s = 4 ms T avgtransfer = 60/7200 RPM /400 s/sektor 000 ms/s= 0.02 ms T avgzugriff = 9 ms + 4 ms ms 3 ms Norman Hendrich 36

137 Die Speicherhierarchie - Festplatten Festplatten-Zugriffzeit: wichtige Punkte Zugriffszeit von Suchzeit und Rotationslatenzzeit dominiert erstes Bit eines Sektors ist das teuerste, der Rest ist danach quasi umsonst typische Dauertransferraten aktueller Festplatten sind im Bereich MB/s SRAM Zugriffszeit ist ca. 4 ns/64 bit, DRAM ca. 60 ns Zugriff auf Festplatte ist um Faktor 3 ms / 4 ns bzw langsamer als SRAM ensprechend langsamer als DRAM hoher Aufwand in Hardware und Betriebssystem, um dieses Problem (weitgehend) zu vermeiden Norman Hendrich 37

138 Die Speicherhierarchie - Festplatten Logische Festplattenblöcke Benutzersicht der komplexen Sektorengeometrie: Menge verfügbarer Sektoren wird als eine Sequenz logischer Blöcke der Größe b modelliert (0,,2,..,n) typische Blockgröße war jahrzehntelang b = 52 Bytes neuere Festplatten zunehmend mit b = 4096 Bytes Abbildung zwischen logischen Blöcken und tatsächlichen physikalischen Sektoren ausgeführt durch den Festplattencontroller konvertiert logische Blöcke zu Tripeln (Oberfläche, Spur, Sektor) Controller reserviert ggf. unbenutze Bereiche als Ersatzzylinder Unterschied zwischen formatierter- und maximaler Kapazität Norman Hendrich 38

139 Die Speicherhierarchie - Festplatten Lesen eines Festplattensektors CPU übergibt Parameter an den Festplattencontroller Befehl, logische Blocknummer, Zielspeicheradresse Zugriff auf den Port (I/O-Adresse) des Controllers CPU chip register file ALU bus interface main memory I/O bus USB controller mouse keyboard graphics adapter monitor disk controller disk Norman Hendrich 39

140 Die Speicherhierarchie - Festplatten Lesen eines Festplattensektors (2) Festplattencontroller liest den gewünschten Sektor aus Festplattencontroller führt DMA-Zugriff auf Hauptspeicher aus CPU chip register file ALU bus interface main memory I/O bus USB controller mouse keyboard graphics adapter monitor disk cont oller disk Norman Hendrich 40

141 Die Speicherhierarchie - Festplatten Lesen eines Festplattensektors (3) Festplattencontroller löst Interrupt aus CPU chip register file ALU bus interface main memory I/O bus USB controller mouse keyboard graphics adapter monitor disk controller disk Norman Hendrich 4

142 Die Speicherhierarchie - RAID RAID: Redundant Array of Independent Disks Aufteilung von Daten auf mehrere Festplatten?! bahnbrechende Untersuchung von Festplatten-Performance motiviert durch Analyse von Großrechner- und PC-Festplatten schnelles Speichersystem aus mehreren kleinen Festplatten (anstelle weniger großer teurer Platten) Zuverlässigkeit des Gesamtsystems? sieben RAID-Varianten ( level ) unterschiedliche Anzahl von Platten Strategien zur Verwendung von Nutz- und Reserveplatten Ausfallsicherheit, Hot-Plugging Optimierung auf Schreib- und/oder Leseperformance für Server vielfach eingesetzt Originalpaper: Patterson, Gibson, Katz: UCB report CS-87-39) Norman Hendrich 42

143 Die Speicherhierarchie - RAID RAID: Ausgangsbasis (998) Norman Hendrich 43

144 Die Speicherhierarchie - RAID Zuverlässigkeit: Headcrash Zerstörung der Magnetschicht durch Kontakt mit dem Lesekopf (wikimedia commons, Alchemist-hp, Norman Hendrich 44

145 Die Speicherhierarchie - RAID RAID: mehrere Varianten, level 0..6 Norman Hendrich 45

146 Die Speicherhierarchie - RAID RAID 0: Striping die Datenblöcke werden gleichmäßig auf zwei oder mehr unabhängige Platten verteilt gleichzeitiges Lesen Blöcke von mehreren Platten gleichzeitiges Schreiben auf mehrere Platten Performance wächst (linear) mit der Anzahl der Platten bei Ausfall einer Platte sind sämtliche Daten verloren Einsatz z.b. zwei Platten für schnellen Videoschnitt Norman Hendrich 46

147 Die Speicherhierarchie - RAID RAID : Mirroring jeder Platteninhalt ist zweimal vorhanden Lesezugriffe können auf beiden Platten verteilt werden Schreibzugriffe immer doppelt auf beide Platten bei Ausfall einer Platte nutzt man das Duplikat und erstellt eine neue Reserveplatte Norman Hendrich 47

148 Die Speicherhierarchie - RAID RAID 2: fehlerkorrigierende Codes Kodieren aller Daten mit fehlerkorrigierendem Bitcode Originalbits und Prüfbits werden auf verschiedene Platten verteilt Beispiel: (7,4)-Hamming-Code, mit 4+3 Platten jeder Datenzugriff erfordert viele synchronisierte Plattenoperationen vor jedem Schreibzugriff Berechnung der bitweisen Prüfbits insgesamt erscheint der Aufwand nicht gerechtfertigt Norman Hendrich 48

149 Die Speicherhierarchie - RAID RAID 2: mit (7,4) Hamming-Code Gleichungssystem: k2 = x2 x x0 k = x3 x x0 k0 = x3 x2 x0 Norman Hendrich 49

150 Die Speicherhierarchie - RAID RAID 3: Bit-Parität mehrere Platten plus eine Paritätsplatte dadurch Schutz gegen Totalausfall einer einzelnen Platte Daten müssen bitweise berechnet werden Beispiel: Originaldaten auf vier Platten aufgeteilt, zusätzlich eine Paritätsplatte Bildung der Modulo-2-Summe über die entsprechenden Bits, p = x 0 x x 2 x 3 bei Ausfall einer der Platten 0 bis 4 (hier: Platte ) Rekonstruktion des Inhalt mittels Modulo-2 Summe: x = x 0 x 2 x 3 x 4 p Norman Hendrich 50

151 Die Speicherhierarchie - RAID RAID 3: Beispiel mit 4+ Platten X 0 X X 2 X 3 X 0 X X 2 X p p X 0 X X 2 X 3 p X X 0 X X 2 3 p Norman Hendrich 5

152 Die Speicherhierarchie - RAID RAID 4, 5, 6 RAID 4: Dies ist ähnlich zu RAID 3. Die Paritätsinformation nutzt man nur bei Totalausfall einer Platte. Daher führen nur Schreibzugriffe zu einer erhöhten Last. Jeder Schreibzugriff erfordert zwei Lese- und zwei Schreibzugriffe. RAID 5: Um den Flaschenhals der Paritätsplatte zu mildern, verteilt man die Redundanzinformation zyklisch über alle Platten. RAID 6: Hier erhöht man die Datensicherheit gegenüber RAID 5 durch Bildung mehrerer unabhängiger Schutzinformationen. Norman Hendrich 52

153 Die Speicherhierarchie - CD-ROM und DVD Optische Speichermedien: Beispiel CD-ROM CD-ROM = Compact Disc Read-Only Memory Weiterentwicklung der Audio-CD (982) Aufzeichnungspirale der Daten ca. 5 km Länge Speicherkapazität: 74-Minuten-CD-DA: ca. 783 MB Audiodaten CD-ROM: zusätzliche Fehlerkorrektur, netto ca. 650 MB Nutzdaten Standards: Audio-CD und CD-ROM sind IEC 908 ( red book ) ISO/IEC 049 ( yellow book ) Norman Hendrich 53

154 Die Speicherhierarchie - CD-ROM und DVD CD/DVD: Prinzip Polycarbonatträger, 2cm Durchmesser eingeprägte Vertiefungen ("pits") bilden die Daten spiralförmige Datenspur,.6µm Abstand, ca Windungen Fertigungsmängel fest eingeplant => leistungsfähige Fehlerkorrektur (CD ROM the new papyrus) Norman Hendrich 54

155 Die Speicherhierarchie - CD-ROM und DVD CD/DVD: Aufbau eines Players Objektiv, magnetische Fokussierung Strahlteiler Spindelmotor Laserdiode Führungsschiene und Motor für Pickup Zylinderlinse Photosensor (2x2 Matrix) Prinzip für CD und DVD Norman Hendrich 55

Virtueller Speicher und Memory Management

Virtueller Speicher und Memory Management Virtueller Speicher und Memory Management Speicher-Paradigmen Programmierer ein großer Adressraum linear adressierbar Betriebssystem eine Menge laufender Tasks / Prozesse read-only Instruktionen read-write

Mehr

Modul IP7: Rechnerstrukturen

Modul IP7: Rechnerstrukturen 64-4 Modul IP7: Rechnerstrukturen http://tams.informatik.uni-hamburg.de/ lectures/211ws/vorlesung/rs Kapitel 21 Andreas Mäder Universität Hamburg Fakultät für Mathematik, Informatik und Naturwissenschaften

Mehr

Technische Informatik 1 - HS 2017

Technische Informatik 1 - HS 2017 Institut für Technische Informatik und Kommunikationsnetze Prof. L. Thiele Technische Informatik 1 - HS 2017 Übung 11 Datum: 21. 22. 12. 2017 Virtueller Speicher 1 Performanz Gehen Sie von einem virtuellen

Mehr

Speicher. Speicher. Speicherhierarchie. Speicher. Interessante Zahlen:

Speicher. Speicher. Speicherhierarchie. Speicher. Interessante Zahlen: Übersicht 1 Einleitung Hauptspeicher 2 Hauptspeicher 3 Caches, Cache-Kohärenz Dr.-Ing. Volkmar Sieh Institut für Informatik 3: Rechnerarchitektur Friedrich-Alexander-Universität Erlangen-Nürnberg WS 2008/2009

Mehr

Quiz. Gegeben sei ein 16KB Cache mit 32 Byte Blockgröße. Wie verteilen sich die Bits einer 32 Bit Adresse auf: Tag Index Byte Offset.

Quiz. Gegeben sei ein 16KB Cache mit 32 Byte Blockgröße. Wie verteilen sich die Bits einer 32 Bit Adresse auf: Tag Index Byte Offset. Quiz Gegeben sei ein 16KB Cache mit 32 Byte Blockgröße. Wie verteilen sich die Bits einer 32 Bit Adresse auf: Tag Index Byte Offset 32 Bit Adresse 31 3 29... 2 1 SS 212 Grundlagen der Rechnerarchitektur

Mehr

In heutigen Computern findet man schnellen/teuren als auch langsamen/billigen Speicher

In heutigen Computern findet man schnellen/teuren als auch langsamen/billigen Speicher Speicherhierarchie In heutigen Computern findet man schnellen/teuren als auch langsamen/billigen Speicher Register Speicherzellen, direkt mit der Recheneinheit verbunden Cache-Speicher Puffer-Speicher

Mehr

RO-Tutorien 15 und 16

RO-Tutorien 15 und 16 Tutorien zur Vorlesung Rechnerorganisation Tutorienwoche 10 am 29.06.2011 1 Christian A. Mandery: KIT Universität des Landes Baden-Württemberg und nationales Grossforschungszentrum in der Helmholtz-Gemeinschaft

Mehr

Modul InfB-RS: Rechnerstrukturen

Modul InfB-RS: Rechnerstrukturen 64-040 Rechnerstrukturen 64-040 Modul InfB-RS: Rechnerstrukturen http://tams.informatik.uni-hamburg.de/ lectures/2014ws/vorlesung/rs Kapitel 18 Andreas Mäder Universität Hamburg Fakultät für Mathematik,

Mehr

Cache Blöcke und Offsets

Cache Blöcke und Offsets Cache Blöcke und Offsets Ein Cache Eintrag speichert in der Regel gleich mehrere im Speicher aufeinander folgende Bytes. Grund: räumliche Lokalität wird wie folgt besser ausgenutzt: Bei Cache Miss gleich

Mehr

Modul IP7: Rechnerstrukturen

Modul IP7: Rechnerstrukturen 64-040 Rechnerstrukturen 64-040 Modul IP7: Rechnerstrukturen http://tams.informatik.uni-hamburg.de/ lectures/2012ws/vorlesung/rs Kapitel 18 Andreas Mäder Universität Hamburg Fakultät für Mathematik, Informatik

Mehr

Zwei Möglichkeiten die TLB zu aktualisieren

Zwei Möglichkeiten die TLB zu aktualisieren Zwei Möglichkeiten die TLB zu aktualisieren Die MMU kümmert sich um alles (Hardware-Lösung) sucht die p-entry wenn diese nicht da ist, behandelt direkt das TLB-miss zum Schluss wird die neue p-entry (virt

Mehr

Modul InfB-RS: Rechnerstrukturen

Modul InfB-RS: Rechnerstrukturen A. Mäder 1 MIN-Fakultät Fachbereich Informatik 64-040 Modul InfB-RS: Rechnerstrukturen https://tams.informatik.uni-hamburg.de/ lectures/2016ws/vorlesung/rs Kapitel 18 Andreas Mäder Universität Hamburg

Mehr

é Er ist software-transparent, d.h. der Benutzer braucht nichts von seiner Existenz zu wissen. Adreßbus Cache- Control Datenbus

é Er ist software-transparent, d.h. der Benutzer braucht nichts von seiner Existenz zu wissen. Adreßbus Cache- Control Datenbus 4.2 Caches é Cache kommt aus dem Französischen: cacher (verstecken). é Er kann durch ein Anwendungsprogramm nicht explizit adressiert werden. é Er ist software-transparent, d.h. der Benutzer braucht nichts

Mehr

Vorlesung: Rechnerstrukturen, Teil 2 (Modul IP7)

Vorlesung: Rechnerstrukturen, Teil 2 (Modul IP7) Vorlesung: Rechnerstrukturen, Teil 2 (Modul IP7) Vorlesung: Rechnerstrukturen, Teil 2 (Modul IP7) J. Zhang zhang@informatik.uni-hamburg.de Universität Hamburg AB Technische Aspekte Multimodaler Systeme

Mehr

Grob-Struktur des Prozessor-Speichersystems

Grob-Struktur des Prozessor-Speichersystems 2.3.2 Speicherstruktur (1) Grob-Struktur des Prozessor-Speichersystems Chipsatz (Erklärung s. später, Folie 104) 22.4.-27.5.2013, Folie 52 2.3.2 Speicherstruktur (2) Zugriff Prozessor zumeist auf schnelle

Mehr

Wie groß ist die Page Table?

Wie groß ist die Page Table? Wie groß ist die Page Table? Im vorigen (typischen) Beispiel verwenden wir 20 Bits zum indizieren der Page Table. Typischerweise spendiert man 32 Bits pro Tabellen Zeile (im Vorigen Beispiel brauchten

Mehr

Grundlagen der Rechnerarchitektur

Grundlagen der Rechnerarchitektur Grundlagen der Rechnerarchitektur Speicher Übersicht Speicherhierarchie Cache Grundlagen Verbessern der Cache Performance Virtueller Speicher SS 2012 Grundlagen der Rechnerarchitektur Speicher 2 Speicherhierarchie

Mehr

Tutorium Rechnerorganisation

Tutorium Rechnerorganisation Woche 11 Tutorien 3 und 4 zur Vorlesung Rechnerorganisation 1 Christian A. Mandery: KIT Universität des Landes Baden-Württemberg und nationales Grossforschungszentrum in der Helmholtz-Gemeinschaft www.kit.edu

Mehr

Virtueller Speicher. SS 2012 Grundlagen der Rechnerarchitektur Speicher 44

Virtueller Speicher. SS 2012 Grundlagen der Rechnerarchitektur Speicher 44 Virtueller Speicher SS 2012 Grundlagen der Rechnerarchitektur Speicher 44 Die Idee Virtuelle Adressen Prozess 1 Speicherblock 0 Speicherblock 1 Speicherblock 2 Speicherblock 3 Speicherblock 4 Speicherblock

Mehr

Rechnerorganisation. 1. Juni 201 KC Posch

Rechnerorganisation. 1. Juni 201 KC Posch .6.2 Rechnerorganisation. Juni 2 KC Posch .6.2 2 .6.2 Front Side Bus Accelerated Graphics Port 28 MHz Front Side Bus North Bridge RAM idge South Bri IDE USB PCI Bus 3 .6.2 Front Side Bus Front Side Bus

Mehr

Besprechung des 9. Übungsblattes Virtuelle Speicherverwaltung Aufgaben

Besprechung des 9. Übungsblattes Virtuelle Speicherverwaltung Aufgaben Themen heute Besprechung des 9. Übungsblattes Virtuelle Speicherverwaltung Aufgaben Besprechung des 9. Übungsblattes Aufgabe 2 Ist in einer Aufgabe wie hier keine explizite Wortbreite angegeben, nicht

Mehr

Betriebssysteme Teil 10 B: Fragen rund um Seitenfehler

Betriebssysteme Teil 10 B: Fragen rund um Seitenfehler Betriebssysteme Teil 10 B: Fragen rund um Seitenfehler 1 Überlegungen Wenn wir einige Seiten eines Programms in den Speicher laden, brauchen wir eine Strategie, welche Seiten als nächstes geladen werden

Mehr

, 2014W Übungsgruppen: Mo., Mi.,

, 2014W Übungsgruppen: Mo., Mi., VU Technische Grundlagen der Informatik Übung 7: Speichermanagement 183.579, 2014W Übungsgruppen: Mo., 12.01. Mi., 14.01.2015 Aufgabe 1: Cache-Adressierung Ein Prozessor mit einer Adresslänge von 20 Bit

Mehr

Schreiben von Pages. Schreiben einer Page in den Swap Space ist sehr teuer (kostet millionen von CPU Zyklen).

Schreiben von Pages. Schreiben einer Page in den Swap Space ist sehr teuer (kostet millionen von CPU Zyklen). Schreiben von Pages Schreiben einer Page in den Swap Space ist sehr teuer (kostet millionen von CPU Zyklen). Write Through Strategie (siehe Abschnitt über Caching) ist hier somit nicht sinnvoll. Eine sinnvolle

Mehr

Besprechung des 8. Übungsblattes Einführung in Caches Cache-Organisation Cache-Ersetzungsstrategien Aufgaben (an der Tafel) Testklausur

Besprechung des 8. Übungsblattes Einführung in Caches Cache-Organisation Cache-Ersetzungsstrategien Aufgaben (an der Tafel) Testklausur Themen heute Besprechung des 8. Übungsblattes Einführung in Caches Cache-Organisation Cache-Ersetzungsstrategien Aufgaben (an der Tafel) Testklausur Besprechung des 8. Übungsblattes Aufgabe 2.6. In diesem

Mehr

Teil 2: Speicherstrukturen

Teil 2: Speicherstrukturen Inhalt Teil 2: Speicherstrukturen Hauptspeicher Cache Assoziativspeicher Speicherverwaltungseinheit ( Memory Management Unit ) 1 Virtueller Speicher Trennung von virtuellem Adreßraum (mit virtuellen Adressen)

Mehr

Rechnernetze und Organisation

Rechnernetze und Organisation Memory 1 Übersicht Motivation Speicherarten Register SRAM, DRAM Flash Speicherhierarchie Cache Virtueller Speicher 2 Motivation Speicher ist zentraler Bestandteil eines Computers neben Prozessor CPU Computer

Mehr

Konzepte von Betriebssystemkomponenten Referat am Thema: Adressräume, Page Faults, Demand Paging, Copy on Write Referent: Johannes Werner

Konzepte von Betriebssystemkomponenten Referat am Thema: Adressräume, Page Faults, Demand Paging, Copy on Write Referent: Johannes Werner Konzepte von Betriebssystemkomponenten Referat am 24.11.2003 Thema: Adressräume, Page Faults, Demand Paging, Copy on Write Referent: Johannes Werner Gliederung Adressräume Page Faults Demand Paging Copy

Mehr

Rechnergrundlagen SS Vorlesung

Rechnergrundlagen SS Vorlesung Rechnergrundlagen SS 2007 13. Vorlesung Inhalt Cache Lesen Schreiben Überschreiben Memory Management Unit (MMU) Translation Lookaside Buffer (TLB) Klausurvorbereitung Inhalte der Klausur Rechnergrundlagen

Mehr

Einführung in die technische Informatik

Einführung in die technische Informatik Einführung in die technische Informatik Christopher Kruegel chris@auto.tuwien.ac.at http://www.auto.tuwien.ac.at/~chris Betriebssysteme Aufgaben Management von Ressourcen Präsentation einer einheitlichen

Mehr

Grundlagen der Informatik III Wintersemester 2010/ Vorlesung Dr.-Ing. Wolfgang Heenes

Grundlagen der Informatik III Wintersemester 2010/ Vorlesung Dr.-Ing. Wolfgang Heenes Grundlagen der Informatik III Wintersemester 2010/2011 25. Vorlesung Dr.-Ing. Wolfgang Heenes int main() { printf("hello, world!"); return 0; } msg: main:.data.asciiz "Hello, world!".text.globl main la

Mehr

Technische Informatik 2 Speichersysteme, Teil 3

Technische Informatik 2 Speichersysteme, Teil 3 Technische Informatik 2 Speichersysteme, Teil 3 Prof. Dr. Miroslaw Malek Sommersemester 2004 www.informatik.hu-berlin.de/rok/ca Thema heute Virtueller Speicher (Fortsetzung) Translation Lookaside Buffer

Mehr

Paging. Einfaches Paging. Paging mit virtuellem Speicher

Paging. Einfaches Paging. Paging mit virtuellem Speicher Paging Einfaches Paging Paging mit virtuellem Speicher Einfaches Paging Wie bisher (im Gegensatz zu virtuellem Speicherkonzept): Prozesse sind entweder ganz im Speicher oder komplett ausgelagert. Im Gegensatz

Mehr

CPU. Memory. Highest. Fastest. Smallest. Memory. Biggest. Lowest

CPU. Memory. Highest. Fastest. Smallest. Memory. Biggest. Lowest Speed CPU Size Cost ($/bit) Fastest Memory Smallest Highest Memory Slowest Memory Biggest Lowest Processor Data are transferred CPU Levels in the memory hierarchy Level Level 2 Increasing distance from

Mehr

Linux Paging, Caching und Swapping

Linux Paging, Caching und Swapping Linux Paging, Caching und Swapping Inhalte Paging Das Virtuelle Speichermodell Die Page Table im Detail Page Allocation und Page Deallocation Memory Mapping & Demand Paging Caching Die verschiedenen Caches

Mehr

Leichtgewichtsprozesse

Leichtgewichtsprozesse Leichtgewichtsprozesse häufiger Prozeßwechsel stellt in einem Betriebssystem eine hohe Belastung dar; auch erfordert die Generierung eines neuen Prozesses viele System-Resourcen in vielen Anwendungen werden

Mehr

Leichtgewichtsprozesse

Leichtgewichtsprozesse Leichtgewichtsprozesse häufiger Prozeßwechsel stellt in einem Betriebssystem eine hohe Belastung dar; auch erfordert die Generierung eines neuen Prozesses viele System-Resourcen in vielen Anwendungen werden

Mehr

Cache. Dr.-Ing. Volkmar Sieh. Institut für Informatik 3: Rechnerarchitektur Friedrich-Alexander-Universität Erlangen-Nürnberg SS 2011

Cache. Dr.-Ing. Volkmar Sieh. Institut für Informatik 3: Rechnerarchitektur Friedrich-Alexander-Universität Erlangen-Nürnberg SS 2011 Cache Dr.-Ing. Volkmar Sieh Institut für Informatik 3: Rechnerarchitektur Friedrich-Alexander-Universität Erlangen-Nürnberg SS 2011 Cache 1/53 2012-02-29 Einleitung Hauptspeicherzugriffe sind langsam die

Mehr

Technische Informatik II Wintersemester 2002/03 Sommersemester 2001. Heiko Holtkamp Heiko@rvs.uni-bielefeld.de

Technische Informatik II Wintersemester 2002/03 Sommersemester 2001. Heiko Holtkamp Heiko@rvs.uni-bielefeld.de Technische Informatik II Wintersemester 2002/03 Sommersemester 2001 Heiko Holtkamp Heiko@rvs.uni-bielefeld.de Speicher ist eine wichtige Ressource, die sorgfältig verwaltet werden muss. In der Vorlesung

Mehr

Linker: Adreßräume verknüpfen. Informationen über einen Prozeß. Prozeß-Erzeugung: Verwandtschaft

Linker: Adreßräume verknüpfen. Informationen über einen Prozeß. Prozeß-Erzeugung: Verwandtschaft Prozeß: drei häufigste Zustände Prozeß: anatomische Betrachtung jeder Prozeß verfügt über seinen eigenen Adreßraum Sourcecode enthält Anweisungen und Variablen Compiler überträgt in Assembler bzw. Binärcode

Mehr

4.3 Hintergrundspeicher

4.3 Hintergrundspeicher 4.3 Hintergrundspeicher Registers Instr./Operands Cache Blocks Memory Pages program 1-8 bytes cache cntl 8-128 bytes OS 512-4K bytes Upper Level faster Disk Tape Files user/operator Mbytes Larger Lower

Mehr

Wunschvorstellung der Entwickler vom Speicher

Wunschvorstellung der Entwickler vom Speicher Wunschvorstellung der Entwickler vom Speicher Unendlich groß Unendlich schnell Nicht flüchtig billig Obwohl sich der verfügbare Speicher laufend erhöht, wird immer mehr Speicher benötigt, als verfügbar

Mehr

Grundlagen der Informatik III Wintersemester 2010/2011

Grundlagen der Informatik III Wintersemester 2010/2011 Grundlagen der Informatik III Wintersemester 2010/2011 Wolfgang Heenes, atrik Schmittat 12. Aufgabenblatt 07.02.2011 Hinweis: Der Schnelltest und die Aufgaben sollen in den Übungsgruppen bearbeitet werden.

Mehr

Main Memory. Hauptspeicher. Memories. Speichermodule. SIMM: single inline memory module 72 Pins. DIMM: dual inline memory module 168 Pins

Main Memory. Hauptspeicher. Memories. Speichermodule. SIMM: single inline memory module 72 Pins. DIMM: dual inline memory module 168 Pins 5 Main Memory Hauptspeicher Memories 2 Speichermodule SIMM: single inline memory module 72 Pins DIMM: dual inline memory module 68 Pins 3 Speichermodule 4 Speichermodule 5 Speichermodule 6 2 Hauptspeicher

Mehr

6 Exkurs: Assoziativspeicher (2) 6 Exkurs: Assoziativspeicher. 7.1 Speicherhierarchie. 7 Caches

6 Exkurs: Assoziativspeicher (2) 6 Exkurs: Assoziativspeicher. 7.1 Speicherhierarchie. 7 Caches 6 Exkurs: Assoziativspeicher alternative Möglichkeit der Speicherung von Informationen in einem Computer: Assoziativspeicher (inhaltsadressierbarer Speicher bzw. CAM = Content Addressable Memory) : bei

Mehr

Speicherorganisation

Speicherorganisation Speicherorganisation John von Neumann 1946 Ideal wäre ein unendlich großer, undendlich schneller und undendlich billiger Speicher, so dass jedes Wort unmittelbar, d.h. ohne Zeitverlust, zur Verfügung steht

Mehr

Echtzeitbetriebssysteme

Echtzeitbetriebssysteme Speicherverwaltung (Memory Management) Aufgaben der Memory-Management-Unit ist l der Speicherschutz und l die Adressumsetzung Wird durch Hardware unterstützt l Memory Management Unit (MMU) l MMU wird vom

Mehr

Aufgabe 4 : Virtueller Speicher

Aufgabe 4 : Virtueller Speicher Sommer 216 Technische Informatik I Lösungsvorschlag Seite 16 Aufgabe 4 : Virtueller Speicher (maximal 27 Punkte) 4.1: Generelle Funktionsweise (maximal 5 Punkte) (a) (1 Punkt) Nennen Sie zwei Gründe, weshalb

Mehr

RO-Tutorien 17 und 18

RO-Tutorien 17 und 18 RO-Tutorien 17 und 18 Tutorien zur Vorlesung Rechnerorganisation Christian A. Mandery TUTORIENWOCHE 12 AM 19.07.2012 KIT Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der

Mehr

Hauptspeicherverwaltung - Memory Management

Hauptspeicherverwaltung - Memory Management Hauptspeicherverwaltung - Memory Management Operating Systems I SS21 Prof. H.D.Clausen - unisal 1 Speicherhierarchie Verarbeitung cache Sekundär- Speicher Primär- Speicher ALU SS21 Prof. H.D.Clausen -

Mehr

Arithmetische und Logische Einheit (ALU)

Arithmetische und Logische Einheit (ALU) Arithmetische und Logische Einheit (ALU) Enthält Blöcke für logische und arithmetische Operationen. n Bit Worte werden mit n hintereinander geschalteten 1 Bit ALUs bearbeitet. Steuerleitungen bestimmen

Mehr

Lösung von Übungsblatt 2

Lösung von Übungsblatt 2 Lösung von Übungsblatt 2 Aufgabe 1 (Digitale Datenspeicher) 1. Nennen Sie einen digitalen Datenspeicher, der mechanisch arbeitet. Lochstreifen, Lochkarte, CD/DVD beim Pressen. 2. Nennen Sie zwei rotierende

Mehr

Enterprise Computing Einführung in das Betriebssystem z/os. Prof. Dr. Martin Bogdan Prof. Dr.-Ing. Wilhelm G. Spruth WS2012/13

Enterprise Computing Einführung in das Betriebssystem z/os. Prof. Dr. Martin Bogdan Prof. Dr.-Ing. Wilhelm G. Spruth WS2012/13 UNIVERSITÄT LEIPZIG Enterprise Computing Einführung in das Betriebssystem z/os Prof. Dr. Martin Bogdan Prof. Dr.-Ing. Wilhelm G. Spruth WS2012/13 Verarbeitungsgrundlagen Teil 4 Cache el0100 copyright W.

Mehr

Rechnerstrukturen Winter SPEICHER UND CACHE. (c) Peter Sturm, University of Trier 1

Rechnerstrukturen Winter SPEICHER UND CACHE. (c) Peter Sturm, University of Trier 1 9. SPEICHER UND CACHE (c) Peter Sturm, University of Trier 1 Inhalt Grundlagen Speichertypen RAM / ROM Dynamisches RAM Cache- Speicher Voll AssoziaNv n- Wege AssoziaNv Direct Mapping Beispiel: 8 Bit- Register

Mehr

Überschrift. Speicherverwaltung. Prof. Dr. Margarita Esponda Freie Universität Berlin 2011/2012

Überschrift. Speicherverwaltung. Prof. Dr. Margarita Esponda Freie Universität Berlin 2011/2012 Überschrift Speicherverwaltung Prof. Dr. Margarita Esponda Freie Universität Berlin 2011/2012 1 Hauptziele: Speicherverwaltung Speicher ist die zweite wichtigste Ressource, die das Betriebssystem verwalten

Mehr

Cache II. Dr.-Ing. Volkmar Sieh. Institut für Informatik 3: Rechnerarchitektur Friedrich-Alexander-Universität Erlangen-Nürnberg SS 2011

Cache II. Dr.-Ing. Volkmar Sieh. Institut für Informatik 3: Rechnerarchitektur Friedrich-Alexander-Universität Erlangen-Nürnberg SS 2011 Cache II Dr.-Ing. Volkmar Sieh Institut für Informatik 3: Rechnerarchitektur Friedrich-Alexander-Universität Erlangen-Nürnberg SS 2011 Cache II 1/14 2012-02-29 Schreibstrategien Es sind verschiedene Fälle

Mehr

Systeme I: Betriebssysteme Kapitel 8 Speicherverwaltung

Systeme I: Betriebssysteme Kapitel 8 Speicherverwaltung Systeme I: Betriebssysteme Kapitel 8 Speicherverwaltung Version 21.12.2016 1 Inhalt Vorlesung Aufbau einfacher Rechner Überblick: Aufgabe, Historische Entwicklung, unterschiedliche Arten von Betriebssystemen

Mehr

Proseminar Konzepte von Betriebssystem- Komponenten (KVBK) Vortrag zum Thema: Speicheraddressierung, Segmentierung, Paging

Proseminar Konzepte von Betriebssystem- Komponenten (KVBK) Vortrag zum Thema: Speicheraddressierung, Segmentierung, Paging Proseminar Konzepte von Betriebssystem- Komponenten (KVBK) Vortrag zum Thema: Speicheraddressierung, Segmentierung, Paging Grundlegende Bedeutung von Speicheradressierung: Wie sind die Daten auf Dem Speicher

Mehr

Algorithm Engineering. Alexander Kröller, Abteilung Algorithmik, IBR

Algorithm Engineering. Alexander Kröller, Abteilung Algorithmik, IBR #7 Terminchaos Nächste Vorlesungen: 27. 5. Vertretung durch Prof. Fekete 3. 6. Exkursionswoche 10. 6. Vertretung durch N.N. 17. 6. back to normal... Experiment Durchlaufe zwei gleichgrosse Arrays: Sortierte

Mehr

Technische Informatik 1 - Übung & 22. Dezember Philipp Miedl

Technische Informatik 1 - Übung & 22. Dezember Philipp Miedl Technische Informatik 1 - Übung 11 21. & 22. Dezember 2017 Philipp Miedl Philipp Miedl 21.12.2017 22.12.2017 1 Motivation Aufteilen des Hauptspeichers auf mehrere Prozesse Philipp Miedl 21.12.2017 22.12.2017

Mehr

Tutorium Rechnerorganisation

Tutorium Rechnerorganisation Woche 10 Tutorien 3 und 4 zur Vorlesung Rechnerorganisation 1 Christian A. Mandery: KIT Universität des Landes Baden-Württemberg und nationales Grossforschungszentrum in der Helmholtz-Gemeinschaft www.kit.edu

Mehr

Rechnerarchitektur. Vorlesungsbegleitende Unterlagen. WS 2003/2004 Klaus Waldschmidt

Rechnerarchitektur. Vorlesungsbegleitende Unterlagen. WS 2003/2004 Klaus Waldschmidt Rechnerarchitektur Vorlesungsbegleitende Unterlagen WS 2003/2004 Klaus Waldschmidt Teil 15 Speicherhierarchie und s Seite 1 Speicherhierarchie: Der Speicherraum wird in einzelne Schichten unterteilt, die

Mehr

Digital Design Entwicklung der DRAMs. Richard Roth / FB Informatik und Mathematik Speicher 1

Digital Design Entwicklung der DRAMs. Richard Roth / FB Informatik und Mathematik Speicher 1 Entwicklung der DRAMs Richard Roth / FB Informatik und Mathematik Speicher 1 Entwicklung der DRAMs in Zukunft Richard Roth / FB Informatik und Mathematik Speicher 2 DRAM Speicherzelle (Trench Technology)

Mehr

(Prof. Dr. J. Schlichter, WS 2011 / 2012) Übungsleitung: Dr. Wolfgang Wörndl

(Prof. Dr. J. Schlichter, WS 2011 / 2012) Übungsleitung: Dr. Wolfgang Wörndl Übung zur Vorlesung Grundlagen Betriebssysteme und Systemsoftware (Prof. Dr. J. Schlichter, WS 2011 / 2012) Übungsleitung: Dr. Wolfgang Wörndl (gbs-ws11@mailschlichter.informatik.tu-muenchen.de) http://www11.in.tum.de/veranstaltungen/grundlagenbetriebssystemeundsystemsoftwarews1112

Mehr

Mikroprozessortechnik Grundlagen 1

Mikroprozessortechnik Grundlagen 1 Grundlagen - Grundbegriffe, Aufbau, Rechnerarchitekturen, Bus, Speicher - Maschinencode, Zahlendarstellung, Datentypen - ATMELmega28 Progammierung in C - Vergleich C und C++ - Anatomie eines µc-programmes

Mehr

Vorlesung 14 Speichersysteme (2)

Vorlesung 14 Speichersysteme (2) D - CA - XIV - MH - 1 HUMBOLDT-UNIVERSITÄT ZU BERLIN INSTITUT FÜR INFORMATIK Vorlesung 14 Speichersysteme (2) Sommersemester 2003 Leitung: Prof. Dr. Miroslaw Malek D - CA - XIV - MH - 2 SPEICHERSYSTEME

Mehr

RAM. Konsistenzprobleme entstehen => CPU - durch Verzögerung in Warteschlange, Umfangreiche Pufferung in den PCI Brücken. lesen. EOP-Signal.

RAM. Konsistenzprobleme entstehen => CPU - durch Verzögerung in Warteschlange, Umfangreiche Pufferung in den PCI Brücken. lesen. EOP-Signal. 11. s 11.1 Pufferspeicher Lesepuffer um vorauszulesen: - erste Leseoperation hat lange Latenzzeit, - Folgedaten vorsorglich schon gelesen, - "prefetch buffer". Schreibpuffer um ein Blockieren des schreibenden

Mehr

Freispeicherverwaltung Martin Wahl,

Freispeicherverwaltung Martin Wahl, Freispeicherverwaltung Martin Wahl, 17.11.03 Allgemeines zur Speicherverwaltung Der physikalische Speicher wird in zwei Teile unterteilt: -Teil für den Kernel -Dynamischer Speicher Die Verwaltung des dynamischen

Mehr

Teil VIII Von Neumann Rechner 1

Teil VIII Von Neumann Rechner 1 Teil VIII Von Neumann Rechner 1 Grundlegende Architektur Zentraleinheit: Central Processing Unit (CPU) Ausführen von Befehlen und Ablaufsteuerung Speicher: Memory Ablage von Daten und Programmen Read Only

Mehr

Betriebssysteme I WS 2016/2017. Betriebssysteme / verteilte Systeme Tel.: 0271/ , Büro: H-B 8404

Betriebssysteme I WS 2016/2017. Betriebssysteme / verteilte Systeme Tel.: 0271/ , Büro: H-B 8404 Betriebssysteme I WS 2016/2017 Betriebssysteme / verteilte Systeme rolanda.dwismuellera@duni-siegena.de Tel.: 0271/740-4050, Büro: H-B 8404 Stand: 2. Februar 2017 Betriebssysteme / verteilte Systeme Betriebssysteme

Mehr

Grundlagen der Informatik III Wintersemester 2010/ Vorlesung Dr.-Ing. Wolfgang Heenes

Grundlagen der Informatik III Wintersemester 2010/ Vorlesung Dr.-Ing. Wolfgang Heenes Grundlagen der Informatik III Wintersemester 2010/2011 15. Vorlesung Dr.-Ing. Wolfgang Heenes int main() { printf("hello, world!"); return 0; } msg: main:.data.asciiz "Hello, world!".text.globl main la

Mehr

7. Speicherverwaltung

7. Speicherverwaltung 7. Speicherverwaltung Ziele Zuteilung des Arbeitsspeicher Abbildung der symbolischen Adresse auf die physikalische Adresse Adress-Transformation Symbolische Adresse verschiebbare Adresse physikalische

Mehr

Grundlagen der Informatik III Wintersemester 2010/2011

Grundlagen der Informatik III Wintersemester 2010/2011 Grundlagen der Informatik III Wintersemester 21/211 Wolfgang Heenes, atrik Schmittat 12. Aufgabenblatt mit Lösungsvorschlag 7.2.211 Hinweis: Der Schnelltest und die Aufgaben sollen in den Übungsgruppen

Mehr

2. Ansatzpunkt: Reduktion der Penalty Early Restart und critical word first

2. Ansatzpunkt: Reduktion der Penalty Early Restart und critical word first 2. Ansatzpunkt: Reduktion der Penalty 2.1. Early Restart und critical word first Beide Techniken basieren darauf, die Wartezeit der CPU auf das Mindestmaß zu beschränken. Early restart lädt den Block wie

Mehr

Technische Informatik I. Übung 3 Speicherhierarchie. v t d 0 d 1 d 2 d 3 0 1 2 3. Technische Informatik I Übung 3. Technische Informatik I Übung 3

Technische Informatik I. Übung 3 Speicherhierarchie. v t d 0 d 1 d 2 d 3 0 1 2 3. Technische Informatik I Übung 3. Technische Informatik I Übung 3 Institut für Kommunikationsnetze und Rechnersysteme Technische Informatik I Paul J. Kühn, Matthias Meyer Übung 3 Speicherhierarchie Inhaltsübersicht Aufgabe 3.1 Daten-Cache Aufgabe 3.2 Virtueller Speicher

Mehr

(Cache-Schreibstrategien)

(Cache-Schreibstrategien) Übungsblatt 2 Aufgabe 1 (Digitale Datenspeicher) 1. Nennen Sie einen digitalen Datenspeicher, der mechanisch arbeitet. 2. Nennen Sie zwei rotierende magnetische digitale Datenspeicher. 3. Nennen Sie zwei

Mehr

CA Übung 30.01.2006. Christian kann heute nicht kommen => ich bin heute da, Christian das nächste Mal wieder

CA Übung 30.01.2006. Christian kann heute nicht kommen => ich bin heute da, Christian das nächste Mal wieder CA Übung 30.01.2006 Hallo zusammen! Christian kann heute nicht kommen => ich bin heute da, Christian das nächste Mal wieder Adrian Schüpbach: scadrian@student.ethz.ch Christian Fischlin: cfischli@student.ethz.ch

Mehr

Das Konzept der Speicherhierarchie

Das Konzept der Speicherhierarchie Das Konzept der Speicherhierarchie Small is fast, daher sind kleine Speicher schneller (und kosten mehr pro Byte). Vergrößerung von Speichern und schnellerer Zugriff sind aber Schlüsselfunktionen in der

Mehr

Betriebssysteme Sommersemester Betriebssysteme. 5. Kapitel. Adressumsetzung. Dr. Peter Tröger / Prof. M. Werner. Professur Betriebssysteme

Betriebssysteme Sommersemester Betriebssysteme. 5. Kapitel. Adressumsetzung. Dr. Peter Tröger / Prof. M. Werner. Professur Betriebssysteme Betriebssysteme Sommersemester 2017 Betriebssysteme 5. Kapitel Adressumsetzung Dr. Peter Tröger / Prof. M. Werner Professur Betriebssysteme 5.1 Speicher schneller, teurer, kleiner Betriebssysteme Adressumsetzung

Mehr

CPU Speicher I/O. Abbildung 11.1: Kommunikation über Busse

CPU Speicher I/O. Abbildung 11.1: Kommunikation über Busse Kapitel 11 Rechnerarchitektur 11.1 Der von-neumann-rechner Wir haben uns bisher mehr auf die logischen Bausteine konzentriert. Wir geben jetzt ein Rechnermodell an, das der physikalischen Wirklichkeit

Mehr

Speicher- und Cacheverwaltung unter Linux. Ralf Petring & Guido Schaumann

Speicher- und Cacheverwaltung unter Linux. Ralf Petring & Guido Schaumann Speicher- und Cacheverwaltung unter Linux Ralf Petring & Guido Schaumann Übersicht Virtueller Adressraum Virtuelle Speicheraufteilung Reale Speicheraufteilung Speicherverwaltung Speicherzugriff Auslagerungsstrategien

Mehr

5 Kernaufgaben eines Betriebssystems (BS)

5 Kernaufgaben eines Betriebssystems (BS) 5 Kernaufgaben eines Betriebssystems (BS) Betriebssystem ist eine Menge von Programmen, die die Abarbeitung anderer Programme auf einem Rechner steuern und überwachen, insbesondere verwaltet es die Hardware-Ressourcen

Mehr

183.579, WS2012 Übungsgruppen: Mo., 07.01. Do., 10.01.2013

183.579, WS2012 Übungsgruppen: Mo., 07.01. Do., 10.01.2013 VU Technische Grundlagen der Informatik Übung 7: Speicher, Peripherie 183.579, WS2012 Übungsgruppen: Mo., 07.01. Do., 10.01.2013 Aufgabe 1: Ihre Kreativität ist gefragt! Um die Qualität der Lehrveranstaltung

Mehr

Ein- und Ausgabegeräte

Ein- und Ausgabegeräte Blockorientiert Jeder Block kann unabhängig gelesen und geschrieben werden. Festplatten, CD-ROMs, USB-Sticks, etc. Zeichenorientiert Keine Struktur, nicht adressierbar, Daten werden als Folge von Zeichen

Mehr

Tutorium Rechnerorganisation

Tutorium Rechnerorganisation Woche 11 Tutorien 3 und 4 zur Vorlesung Rechnerorganisation 1 Christian A. Mandery: KIT Universität des Landes Baden-Württemberg und nationales Grossforschungszentrum in der Helmholtz-Gemeinschaft www.kit.edu

Mehr

2.2 Rechnerorganisation: Aufbau und Funktionsweise

2.2 Rechnerorganisation: Aufbau und Funktionsweise 2.2 Rechnerorganisation: Aufbau und Funktionsweise é Hardware, Software und Firmware é grober Aufbau eines von-neumann-rechners é Arbeitsspeicher, Speicherzelle, Bit, Byte é Prozessor é grobe Arbeitsweise

Mehr

Proseminar Konzepte von Betriebssystem-Komponenten (KVBK) Vortrag zum Thema: Speicheraddressierung, Segmentierung, Paging Von Christian Hubert

Proseminar Konzepte von Betriebssystem-Komponenten (KVBK) Vortrag zum Thema: Speicheraddressierung, Segmentierung, Paging Von Christian Hubert Proseminar Konzepte von Betriebssystem-Komponenten (KVBK) Vortrag zum Thema: Speicheraddressierung, Segmentierung, Paging Von Christian Hubert 1.: Speicherung und Adressierung von Daten Bei der Speicheradressierung

Mehr

Rechnerorganisation. Überblick über den Teil 13

Rechnerorganisation. Überblick über den Teil 13 Rechnerorganisation Teil 3 9. Juni 2 KC Posch Überblick über den Teil 3 Arbiter: Wie können sich 2 aktive Partner vertragen? Direkter Speicherzugriff: Ein Ko Prozessor zum Daten Schaufeln Die Verbesserung

Mehr

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. Blatt Nr. 07 Übung zur Vorlesung Einsatz und Realisierung von Datenbanksystemen im SoSe16 Moritz Kaufmann

Mehr

RO-Tutorien 3 / 6 / 12

RO-Tutorien 3 / 6 / 12 RO-Tutorien 3 / 6 / 12 Tutorien zur Vorlesung Rechnerorganisation Christian A. Mandery WOCHE 10 AM 01./02.07.2013 KIT Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft

Mehr

Kapitel VI. Speicherverwaltung. Speicherverwaltung

Kapitel VI. Speicherverwaltung. Speicherverwaltung Kapitel VI Speicherverwaltung 1 Speicherverwaltung Computer exekutiert Programme (mit Daten) im Hauptspeicher. Hauptspeicher: Großes Array von Wörtern (1 oder mehrere Bytes) Jedes Wort hat eine eigene

Mehr

Technische Informatik 2 Speichersysteme, Teil 2

Technische Informatik 2 Speichersysteme, Teil 2 Technische Informatik 2 Speichersysteme, Teil 2 Prof. Dr. Miroslaw Malek Sommersemester 2009 www.informatik.hu-berlin.de/rok/ca Thema heute Virtueller Speicher Virtueller Seitenspeicher Seitenregister

Mehr

Memory Management. Peter Puschner Institut für Technische Informatik peter@vmars.tuwien.ac.at

Memory Management. Peter Puschner Institut für Technische Informatik peter@vmars.tuwien.ac.at Memory Management Peter Puschner Institut für Technische Informatik peter@vmars.tuwien.ac.at 1 Speicherverwaltung Effektive Aufteilung und Verwaltung des Arbeitsspeichers für BS und Programme Anforderungen

Mehr

Freispeicherverwaltung

Freispeicherverwaltung Freispeicherverwaltung Allgemeine Techniken und Anwendung unter Linux Martin Wahl, 17.11.03 Freispeicherverwaltung 1 Überblick Allgemeines Suchstrategien Verwaltungsstrategien externer / interner Verschnitt

Mehr

In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen.

In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen. 1 In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen. Zunächst stellt sich die Frage: Warum soll ich mich mit der Architektur eines DBMS beschäftigen?

Mehr

Übung zu Einführung in die Informatik # 10

Übung zu Einführung in die Informatik # 10 Übung zu Einführung in die Informatik # 10 Tobias Schill tschill@techfak.uni-bielefeld.de 15. Januar 2016 Aktualisiert am 15. Januar 2016 um 9:58 Erstklausur: Mi, 24.02.2016 von 10-12Uhr Aufgabe 1* a),

Mehr

2.3 Prozessverwaltung

2.3 Prozessverwaltung Realisierung eines Semaphors: Einem Semaphor liegt genau genommen die Datenstruktur Tupel zugrunde Speziell speichert ein Semaphor zwei Informationen: Der Wert des Semaphors (0 oder 1 bei einem binären

Mehr