1 / 13 Baustelle Datacenter Baustelle Datacenter Zwischenbericht und Suspendierung SAN-Director Andreas Heik TU-Chemnitz, Universitätsrechenzentrum 26. August 2014
URZ Dienstespektrum URZ Dienstespektrum URZ Dienste Umsetzung durch Funktionsverantwortliche auf virtualisierten Systemen (Virtualisierungsrate 97,9 %) 2 / 13
3 / 13 Baustelle Datacenter Serverraum Serverraum (reale) Server- und Bladesystem Netzwerkkomponenten Speichersysteme Serverhousing CPU- und GPU-Cluster Klimatisierung ausreichend? Projekt: Kaltgangeinhausung Effektivierung der Klimatisierung gleichmäßig verteilte Kaltluft (über die Rackhöhe) Erhöhung der Packungsdichte belüfteter Schrank
3 / 13 Baustelle Datacenter Serverraum Serverraum (reale) Server- und Bladesystem Netzwerkkomponenten Speichersysteme Serverhousing CPU- und GPU-Cluster Klimatisierung ausreichend? Projekt: Kaltgangeinhausung Effektivierung der Klimatisierung gleichmäßig verteilte Kaltluft (über die Rackhöhe) Erhöhung der Packungsdichte Kaltgang Zone 1
Kaltgangeinhausung Kaltgangeinhausung Projekt ist in 3 Bauabschnitte gegliedert Baufreiheit während der Einhausungsarbeiten Standortwechsel für alle Geräte und Komponenten Serverraum Grundriß 4 / 13
Evakuierung Zone 3 Evakuierung Zone 3 betroffen sind: 58 Knoten HPC-Cluster, Professur Theoretische Physik 1 Virtualisierungscluster (5 Hosts, Oktober 2008) wird aufgelöst, Ressourcenübernahme von 80 VPS gesichert 4 Speichersysteme (29 Diskshelfs) Einsatzgebiet Virtualisierung 1 zentraler SAN-Switch Anschlußpunkt der Speichersysteme und Virtualisierungscluster 5 / 13
Evakuierung Zone 3 Evakuierung Zone 3 - im Bild Storage Array STK 6140 SAN Director MDS 9509 6 / 13
7 / 13 Baustelle Datacenter Evakuierung Zone 3 Umzug Speichersysteme - Überblick Inhalt, Einsatzgebiet, Virtualisierung Kapazität, Plattentyp freie Ressourcen identifizieren Verschiebefläche Lieferung belegt Disk-Typ Einsatzgebiet san_urz_05 11/2006 68.4 TB FC,SATA AFS RO-Volumes san_urz_06 12/2007 53.8 TB SATA FTP-Server, Backup-Dienste, BPS, Downloadserver,... san_urz_07 12/2007 12.5 TB FC, SATA VPS-Systemplatten, Datenbanken, BPS-Magma,... san_urz_08 08/2009 60.6 TB FC, SATA AFS, UBC, ZUV,... san_urz_09 09/2010 47.9 TB FC AFS RW-Volumes, Mailboxen, virtuelle Desktops,...
Evakuierung Zone 3 Umzug Speichersysteme Umzug Speichersysteme Erarbeitung eines Konzepts für online-migration Risiken für offline-umbau nicht abschätzbar, Downtime Restrukturierung der SAN-Infrastruktur Funktionsübernahme des SAN-Switch am neuen Standort Integration eines SAN-Switchpaares (Cisco Nexus 5596UP) Konzeption mit Cisco Systems Engineer erarbeitet Evakuierung der Speichersysteme durch Storage-Migration, Datensynchronisation,... Auswirkung auf Durchsatzleistung, zeitaufwendig Update aller Softwarekomponenten der leeren Speichersysteme Wiederinbetriebnahme der Speichersysteme Reorganisation der Einsatzgebiete, Befüllung 8 / 13
Effekte und Resultate Effekte und Resultate 1 Projekt: Restrukturierung SAN-Infrastruktur Ablösung SAN-Switch MDS 9509, Vereinfachung der Struktur, Ablösung IVR Update der Virtualisierungsplattform auf vsphere 5.5 vcenter-server mit integrierter DB, ESXi-Hosts, Managementsoftware Neues Virtualisierungscluster auf UCS-Hardware in Betrieb genommen Voraussetzung für Auflösung des DELL-Clusters (PowerEdge 905) Update der beteiligten Netzwerkkomponenten und Server UCS (Switch + Server), Nexus 1000V, Nexus 5020,... Update der Speichersysteme und deren Management neue Features: RAID 6, ALUA-Multipath, keine kritischen Firmwareversionen 9 / 13
Effekte und Resultate Effekte und Resultate 2 Inventur des Speicher-Ressourceneinsatzes Freigabe nicht referenzierter virtueller Disks und ISO-Images Planung für Nachfolge- und Erweiterungsbeschaffung von Speichersystemen Bedarfsermittlung und -abschätzung Management-Werkzeugkasten um nützliche Tools ergänzt z.b. scriptbasierte Storage-Migration Dokumentationen und Notfallpläne wurden aktualisiert und ergänzt 10 / 13
Effekte und Resultate Suspendierung SAN-Director Cisco MDS 9509 Lieferung 12/2007 9 Slot Chassis 2 Supervisor-Module (active/ha-standby) 2 FibreChannel Module 4Gbps, 24 Ports 1 FibreChannel Modul 8Gbps, 24 Ports - defekt seit 01/2014 2 FibreChannel Module 2Gbps, 16 Ports (als temporärer Ersatz für 8Gbps Modul) m9 1 060 2# show system uptime System s t a r t time : Wed Nov 19 10:43:41 2008 System uptime : 2442 days, 22 hours, 18 minutes, 54 seconds Kernel uptime : 259 days, 6 hours, 31 minutes, 11 seconds 11 / 13
Ausblick Ausblick bauliche Fertigstellung der Zone 3 infrastrukturelle Erschließung der Zone 2 und 3 Netzwerkports,... Nachfolge- und Erweiterungsbeschaffung Speicherressourcen Inbetriebnahme, Reorganisiation der Inhalte, Suspendierung der Altsysteme Umzug von 5 Servern aus 012 Hardware für Desktop-Virtualisierung in UCS-Umgebung integrieren Erweiterung der UCS-Hardware für Server-Virtualisierung Ergebnisse aus dem Projekt RenewIT verwerten Kooperation mit Strömungsmechanik, thermisches Monitoring Data Center Infrastructure Management System etablieren Rackbelegung, Seriennummern, Servicetags, Wartungsverträge,... Co-Location planen und aufbauen Dienste- und Datenredundanz, Aktiver Betrieb oder Standby,... 12 / 13
13 / 13 Baustelle Datacenter End Baustelle Datacenter - Zwischenbericht VIELEN DANK FÜR IHRE AUFMERKSAMKEIT!