Lehrveranstaltung Speichersysteme Sommersemester 2009 Kapitel 1: Magne<sche Speichersysteme André Brinkmann
Inhaltsverzeichnis FestplaEen Speicherhistorie AuFau von FestplaEen FestplaEenkopf, arm, Berechnung von Zugriffszeiten Zoning Entwicklungstrends bei FestplaEen Einfluss von TPI, BPI, auf die Geschwindigkeit und den Preis magne<scher Speichersysteme Simula<on von FestplaEen Welche Parameter haben den größten Einfluss bei dem Zugriff auf Speichersysteme Welche Op<mierungsmöglichkeiten ergeben sich hieraus
Speicherhierarchie Primärer Speicher: CPU Register (1 Takt, wenige ns) Cache (10 200 Takte, 0,02 0,5µs) lokaler Hauptspeicher (0,2 4µs) NUMA Speicher (2 10 x lokaler Speicher) Sekundärer Speicher: FestplaEen (2 20 ms) Solid State Disks (0,05 0,5 ms) Cache (0,05 0,5 ms) Ter<ärer Speicher Wechselbare Medien (Tapes, Floppies, CD,... (ms Minuten) Tape Libraries, Op<sche Jukeboxen (wenige Sekunden Minuten) Mega- Giga Bytes Giga-Tera Bytes Tape Schränke (wenige Minuten Tage) Tera-Peta Bytes Kilo - Mega Bytes
Speicherhistorie: Lochkarten Lochkarten ab MiEe des 18. Jahrhunderts Einsatz zur Automa<sierung wiederkehrender Aufgaben, z.b. in Webstühlen, Musikinstrumente Hollerith Lochkarte im Computerbereich weit verbreitete Lochkartenformat geht auf die US amerikanische Volkszählung 1890 zurück Standardisierung des Formats 1928 Einsatz in Computersystemen seit Konrad Zuses Z1 im Jahr 1937 Format der Lochkarten haee Auswirkungen auf Entwicklung von Computersprachen (Cobol, Fortran) Datenverarbeitung erforderte drei Sätze Lochkarten: Ein /Ausgabe, Programm Fassungsvermögen bis zu 80 Byte / Karte Lochkartonsteuerung einer Tanzorgel Folie basiert auf Vorlesung von Prof. R. Burns (Baltimore) / Wikipedia
Speicherhistorie: Bandlaufwerke Einsatz von Magnetbändern 1951 in der UNIVAC I eingeführt Aufnahmedichte von 128 Byte/Inch auf 8 Tracks verteilt (6 Datentracks / 1 Parity / 1 Clock) Geschwindigkeit von bis zu 100 in/s Einsatz zur Speicherung von Batch Applika<onen Hohe Latenz bei dem Zugriff auf Random Access Data Fällt in Start/Stop Modus, wenn Eingangsstrom zu langsam Geringe Geschwindigkeit Hohe Medienbelastung Einsatz heute nur noch als Offline /Backup Medium in der Datensicherung LTO Laufwerke haben Geschwindigkeit von bis zu 120 MByte/s (LTO 4) und unkomprimierte Kapazität von bis zu 800 GByte pro Band EDV Magnetband 6250 CPI (1985) Folie basiert auf Vorlesung von Prof. R. Burns (Baltimore) / Wikipedia
Speicherhistorie: Bandlaufwerke ¼ Cartridges Sun StorageTek StreamLine SL8500 Modular Library System Folie basiert auf Wikipedia / Sun Webseiten
Speicherhistorie: FestplaEen IBM stellt 1956 das erste magne<sche FestplaEenlaufwerk mit der Bezeichnung IBM 350 vor 50 SpeicherplaEen à 24 Zoll Kapazität von 5 MByte Zugriffszeit 600 ms Wurden als Random Access Devices eingeführt FestplaEen waren klein und wurden für Laufzeitdaten als Hauptspeicher genutzt, Bandlaufwerke als persistenter Datenspeicher Heu<ge Speichersysteme bilden sekundären Speicher und werden zunehmend als Archivspeicher verwendet Ein IBM 305 RAMAC, im Vordergrund Mitte/links zwei IBM-350-Festplatten Folie basiert auf Vorlesung von Prof. R. Burns (Baltimore) / Wikipedia
Speicherhistorie: FestplaEen Data density Mbit/sq. in. Capacity of Unit Shown Megabytes 1973: 1. 7 Mbit/sq. in 0.14 GBytes 1979: 7. 7 Mbit/sq. in 2.3 GBytes Source: New York Times, 2/23/98, page C3, Makers of disk drives crowd even more data into even smaller spaces Folie basiert auf Vorlesung von Prof. D. Patterson (Berkeley)
Speicherhistorie: FestplaEen 1989: 63 Mbit/sq. in 60 GBytes 1997: 1450 Mbit/sq. in 2.3 GBytes 1997: 3090 Mbit/sq. in 8.1 GBytes Source: New York Times, 2/23/98, page C3, Makers of disk drives crowd even more data into even smaller spaces Folie basiert auf Vorlesung von Prof. D. Patterson (Berkeley)
Speicherhistorie: FestplaEen Die Entwicklung der FestplaEen wurde mehr durch Formfaktor und Kapazität als durch die Geschwindigkeit vorangetrieben 1970s: Mainframes mit 14 FestplaEen 1980s: Minicomputer, Server mit 8 FestplaEen und 5.25 FestplaEen 1990s: Pizzabox PCs: 3.5 FestplaEen Laptops, Notebooks: 2.5 FestplaEen Palmtops benutzten keine FestplaEen => 1.8 FestplaEen noch nicht erfolgreich auf dem Markt Folie basiert auf Vorlesung von Prof. D. Patterson (Berkeley)
Stand der Technik: Seagate DB35 (2006) 750 GB, 3.5 inch disk 7200 RPM; ATA100 / SATA 9.4 waes (idle) 8.5 ms avg. seek 100 300 MB/s transfer rate 394 = 0.52 / GB Quelle: www.seagate.com
1 FestplaEen 2006 Hitachi Travelstar C4K60: 71 x 54 x 8 mm 60 GB, 4200 RPM, 15 ms Seek 2 PlaEen, 4 Köpfe Digitalkameras, PalmPC 2006 Hitachi Microdrive 3K8 40 x 30 x 5 mm Gewicht 13g 8 GB, 26 MB/s Transferrate Quelle: www.hitachigst.com
FestplaEen Aufgabe: Langzeitspeicher, der nicht flüch<g und güns<g Daten sichert Er soll Groß und Billig sein und darf hierfür in der Speicherhierarchie auch langsam sein. Prozessor Steuerung Datenpfad Speicher Input Output Disk Folie basiert auf Vorlesung von Prof. D. Patterson (Berkeley)
AuFau von FestplaEen Arm Spindle Actuator Head { Platters (12) Folie basiert auf Vorlesung von Prof. D. Patterson (Berkeley)
AuFau von FestplaEen Arm Head Sector Inner Track Outer Track Actuator Platter Informa<onen werden auf einer Anzahl von PlaEen gesichert. PlaEen sind (im allgemeinen) beidsei<g beschreibbar Bits werden auf konzentrischen Kreisen gesichert (Tracks). Hierfür werden Tracks in Sektoren fester Größe (z.b. 512 Byte) eingeteilt. Bei Zugriff verschiebt Kopf auf den angefragten Track (Seek), wartet auf den korrekten Sektor unter dem Kopf, und liest oder schreibt Daten Folie basiert auf Vorlesung von Prof. D. Patterson (Berkeley)
Lesen / Schreibköpfe
Recording Technology
Perpendicular Recording http://www.hitachigst.com/hdd/research/recording_head/pr/perpendicularanimation.html
Geschwindigkeit von FestplaEen Controller Arm Head Sector Inner Track Outer Track Actuator Platter Disk Latenz = Seek Zeit+ Rota<onszeit + Transferzeit + Controller Overhead Seek Zeit: Abhängig von Anzahl der zu überbrückenden Tracks, Kopf Geschwindigkeit, Kopf Beschleunigung, SeEle Zeit Rota<onszeit: Abhängig von Rota<onsgeschwindigkeit, Enwernung des Sektors vom Kopf Transfer Zeit: Abhängig von Bit Dichte (BPI), Rota<onsgeschwindigkeit und Zugriffsgröße Folie basiert auf Vorlesung von Prof. D. Patterson (Berkeley)
Seek Zeit Einflussfaktoren auf die Seek Zeit: Beschleunigung des FestplaEenarms: Beschleunigungen zwischen 30 40g Höheres Gewicht erfordert höhere Krax auf den FestplaEenarm Geringeres Gewicht kann zu Verzerrungen des Arms führen => Head Crash Flächendichte: Höhere TPI und BPI ermöglichen kleineren Durchmesser der FestplaEen bei gleicher Kapazität Kleinere FestplaEendurchmesser ermöglichen leichtere FestplaEenarme höhere mögliche Beschleunigung und geringere Distanzen führen zu geringeren Seek Zeiten Folie basiert auf C. Ruemmler and J. Wilkes: An introduction to disk drive modeling
Zoning: Innere gegen äußere Tracks Ursprünglich: Anzahl der Sektoren/Track für innere und äußere Tracks iden<sch BPI (Bits per Inch) auf den äußeren Spuren geringer als auf den inneren Spuren Technik ermöglicht Einteilung der Disk in verschiedene Zonen zusammenhängender Tracks Jede Zone kann Anzahl Sektoren gemäß seiner innersten Spur wählen BPI bleibt über die Zonen nahezu konstant Höhere Kapazität der FestplaEe Höhere Datenrate bei Zugriff auf die äußeren Sektoren (Umdrehungszahl bleibt konstant) Bandbreite auf den äußeren Tracks 1.7x inneren Tracks Folie basiert auf Vorlesung von Prof. D. Patterson (Berkeley)
FestplaEen Trends Kapazitäts Zuwachs: +100%/Jahr (2x / Jahr) Die FestplaEenkapazität ist so schnell gewachsen, dass die Anzahl der PlaEen innerhalb einer FestplaEe sogar sinkt (einige FestplaEen nutzen nur noch eine PlaEe) Transferrate: +40%/Jahr (2x / 2 Jahren) Rota<ons und Seekzeit: 8%/Jahr (1/2 / 10 Jahre) Flächendichte (Areal Density) Bits, die entlang eines Tracks gesichert werden (Bits per inch, BPI) #Tracks auf der Oberfläche (Tracks per inch, TPI) Hier wich<g: Bit Dichte pro Flächeneinheit (Bits/Inch 2 ), bezeichnet als Flächendichte = BPI x TPI MB/ : > 100%/ Jahr (2x / Jahr) Resul<ert aus weniger Chips pro FestplaEe und höherer Flächendichte Folie basiert auf Vorlesung von Prof. D. Patterson (Berkeley)
FestplaEen Historie: Kapazität
FestplaEen Historie: Flächendichte
FestplaEen Historie: TPI, BPI,
FestplaEen Historie: BPI/TPI
Magne<c Media Roadmap
FestplaEen Historie: Roadmap
FestplaEen Historie: Interne Datenrate
FestplaEen Historie: Zugriffzeiten
FestplaEen Historie: Vergleich HDD DRAM
FestplaEen Historie: Kosten
Fallacy: Verwende Data Transfer Rate Hersteller geben Datenrate beim Zugriff auf die Oberfläche der FestplaEe an Sektoren beinhalten neben den Daten Fehlererkennung und Fehlerkorrektur Felder (bis zu 20% der Sektorgröße) und die Sektornummer Es gibt Leerräume zwischen den Sektoren und den Tracks Regel: FestplaEen können ¾ der angegebenen Datenrate ausliefern, sind also um den Faktor 1,3 langsamer als angegeben Folie basiert auf Vorlesung von Prof. D. Patterson (Berkeley)
Fallacy: Verwende Average Seek Time Hersteller benö<gen Standard für einen fairen Vergleich ( Benchmark ) Berechne alle Seeks von allen Tracks, teile durch die Anzahl der Seeks durchschnieliche Seek Time Der echte DurchschniE hängt von dem Datenlayout auf den FestplaEen und dem Zugriffsmuster der Applika<onen auf diese Daten ab Zugriffe werden häufig auf nahe gelegene Tracks abgelegt Regel: Gemessene Seek Time typischerweise nur 1/3 1/4 der angegebenen Seek Time (d.h., die FestplaEe ist um den Faktor 3 4 schneller bei der Platzierung des Kopfes) Folie basiert auf Vorlesung von Prof. D. Patterson (Berkeley)
Modellierung und Simula<on von Speichersystemen Die Zugriffsgeschwindigkeit auf magne<sche Speichersysteme hat einen hohen Anteil an der Geschwindigkeit des Gesamtsystems Die Komplexität der Zugriffsmuster erschwert theore<sche Analyse der Speichersysteme Reihenfolge der Zugriffe bes<mmt Seek Zeiten und Übertragungsrate In die Analyse gehen viele schwer modellierbare, technische Aspekte ein Verwendet die FestplaEe Zoning? Gibt es auf der FestplaEe nicht genutzte Bereiche? Es wird eine hohe Genauigkeit der Ergebnisse erwartet Folgende Folien basieren auf: Chris Ruemmler and John Wilkes: An introduc,on to disk drive modeling, In IEEE Computer 27(3):17 29, March 1994. Folie basiert auf C. Ruemmler and J. Wilkes: An introduction to disk drive modeling
Zugriffszeit auf eine FestplaEe Controller Arm Head Sector Outer Track Actuator Platter Disk Latenz = Seek Zeit+ Rota<onszeit + Transferzeit + Controller Overhead Seek Zeit: Abhängig von Anzahl der zu überbrückenden Tracks, Kopf Geschwindigkeit, Kopf Beschleunigung, SeEle Zeit Rota<onszeit: Abhängig von Rota<onsgeschwindigkeit, Enwernung des Sektors vom Kopf Transfer Zeit: Abhängig von Bit Dichte (BPI), Rota<onsgeschwindigkeit und Zugriffsgröße Folie basiert auf C. Ruemmler and J. Wilkes: An introduction to disk drive modeling
Average Seek Time Average Seek Time beschreibt wich<gen Aspekt der Zugriffszeit DurchschniEliche Seek Distanz beträgt 1/3 eines Zugriffes über die volle Distanz Verschiedene Berechnungsmöglichkeiten: 1. Messe Zeit für Zugriff mit Seek Distanz von 1/3 eines Zugriffes über die volle Distanz 2. Teile die Zeit für einen vollen Zugriff durch 3 3. Summiere Zeiten für alle verschiedenen Seek Distanzen und teile diese bei der Summe der Möglichkeiten 4. Gewichte die einzelnen Seek Distanzen aus 3. mit ihrer AuxriEswahrscheinlichkeit Welches der Berechnungsmodelle entspricht dem tatsächlichen Verhalten am besten? Folie basiert auf C. Ruemmler and J. Wilkes: An introduction to disk drive modeling
Average Seek Time Warum beträgt die durchschnieliche Seek Distanz nur 1/3 der maximalen Seek Distanz? Nehme hierfür an, dass von jedem Track ein Zugriff auf jeden anderen Track erfolgt. Von Track 1 Zugriff auf Track 2,3,,n mit den Distanzen 1,2,,(n 2), (n 1) Von Track 2 Zugriff auf Track 3,4,,n mit den Distanzen 1,2,,(n 2) Von Track (n 1) nur Zugriff auf Track n mit der Distanz 1 Hieraus kann die folgende Formel gebildet werden: (n-1) mal 2 mal 1 mal
HilfsmiEel Average Seek Time Es gilt für die folgenden Reihen:
Bestandteile der Seek Zeit Ein Seek besteht aus Einer Beschleunigungsphase: Der FestplaEenarm wird bis zum erreichen des halben Weges oder der maximalen Geschwindigkeit beschleunigt Einer Coast Phase: Einem Bereich maximaler Geschwindigkeit Einer Verzögerungsphase: Der FestplaEenarm wird bis zum Erreichen des Zielgebietes abgebremst SeEle Phase: Der Controller jus<ert den FestplaEenkopf Sehr kurze Seeks werden durch SeEle Zeit dominiert (1 3 ms), bzw. bestehen nur aus der SeEle Zeit Kurze Seeks (200 400 Tracks) befinden sich nur in der Beschleunigungsphase Zeit propor<onal zur Wurzel des Enwernung plus der SeEle Zeit Bei langen Seeks bewegt sich der FestplaEenarm hauptsächlich mit konstanter Geschwindigkeit Zeit propor<onal zur Enwernung plus einem Overhead Folie basiert auf C. Ruemmler and J. Wilkes: An introduction to disk drive modeling
SeEle Zeit Die Feinposi<onierung des Kopfes an dem Ende der FestplaEenarmbewegung ist Aufgabe des Track Following Systems Reposi<onierung des FestplaEenarms auch dann notwendig, wenn nur der Kopf und nicht der Track gewechselt wird (entspricht ca. 1/3 der SeEle Zeit) wenn nach dem Lesen des letzten Sektors eines Tracks zu dem ersten Sektor des folgenden Tracks gesprungen wird (volle SeEle zeit) Mit der Trackdichte steigt die Zeit für die Kopfwechselzeit => geht gegen SeEle Zeit des FestplaEenarms Bei Lesezugriffen können Daten bereits vor Beendigung der Feinposi<onierung gelesen werden Geschwindigkeitssteigerung bei Hit Keine Verluste bei Miss Unterschiede der SeEle Zeit für Lesen und Schreiben bis zu 0,75 ms Folie basiert auf C. Ruemmler and J. Wilkes: An introduction to disk drive modeling
Einfluss des Datenlayouts FestplaEe teilt Daten in Sektoren ein Größe zwischen 256 und 1024 Bytes Mapping auf physikalische Sektoren auf der FestplaEe Bad Sectors können versteckt werden und es kann low level Performance Op<mierung durchgeführt werden Zoning: Adjazente Tracks werden in Zonen mit gleicher Anzahl Sektoren eingeteilt (typisch 3 20 Zonen) Track Skewing: Sektor 0 eines jeden Tracks wird verschoben, um die Zeit für den Head oder Track Switch zu kompensieren und mit nahezu voller Bandbreite zugreifen zu können Sparing: Es werden Sektoren auf der FestplaEe reserviert, auf die defekte Sektoren gemapped werden Folie basiert auf C. Ruemmler and J. Wilkes: An introduction to disk drive modeling
Technologie Trends Normalisierte Werte relativ zu 1990 100 10 CPU Leistung Netzwerkbandbreite Speicherbandbreite Festplattenbandbreite Netzwerklatenz Festplattenlatenz 1 1990 1992 1994 1996 1998 2000 Folie basiert auf Vorlesung von Prof. R. Burns (Baltimore)
Amdahl s Law Amdahl s Law wird verwendet, um den Speed Up eines Gesamtsystems zu ermieeln, wenn nur ein Teil des Systems schneller wird Häufig verwendet im Bereich des Parallelen Rechnens Verallgemeinert lautet Amdahl s Law, dass der Speed Up S eines Gesamtsystems gleich, wobei P k der Anteil der Kopien einer Gruppe ist S k der Speed Up (oder Slow Down) für diese Gruppe ist n die Anzahl der Gruppen ist
Annahme: Beispiel für Amdahl s Law 12% eines Programms können beliebig beschleunigt werden 88% des Programms bleiben gleich schnell Frage: Wie hoch ist der Speed Up? Antwort:
Einfluss der IO Geschwindigkeit / Amdahl s Law Annahme: CPU Performanz wächst mit 100% / Jahr, IO Latenz nur mit 8% / Jahr Speed Up sinkt von 29% pro Jahr (1996 1997) auf 14% pro Jahr (1999 2000) Folie basiert auf Vorlesung von Prof. D. Patterson (Berkeley) und von Prof. R. Burns (Baltimore)
Einfluss der IO Geschwindigkeit / Amdahls Law Exponen<elle Geschwindigkeitserhöhungen können Dominanz umkehren Speed Up sinkt von 46% pro Jahr (1996 1997) auf 33% pro Jahr (1999 2000) Folie basiert auf Vorlesung von Prof. D. Patterson (Berkeley) und von Prof. R. Burns (Baltimore)