Computing @ GSI. Walter Schoen, GSI



Ähnliche Dokumente
Hochverfügbarkeit mit Linux

HA Linux Cluster in der Praxis

Linux-HA-Cluster Heartbeat mit DRBD

Ü K 127: Server betreiben

Verfügbarkeit von Applikationen und Failover Szenarien. Winfried Wojtenek.

Neues in Hyper-V Version 2

Mit Clustertechnik zu mehr Verfügbarkeit:


Clustering und Failover mit Linux

Freiberuflicher IT-Berater Schwerpunkte: Unix, Oracle, Netzwerk. Dipl.-Inform. Joachim Jäckel

Macrium Reflect Freeware-Tutorial:

PROLAG WORLD 2.0 PRODUKTBESCHREIBUNG SERVERSYSTEM, CLUSTERSYSTEME FÜR PROLAG WORLD

Anwendung Rechnernetze. 7.Semester INF - WS 2005/2006 Vorstellung der Projekte (Prof. Dr. Uwe Heuert)

Keep your SAN simple Spiegeln stag Replizieren

Übung - Festplattenwartung in Windows Vista

Hardware und Planungsübersicht Ver 1.0

Installation von Windows.NET Enterprise Server RC1

Linux High Availability out of the Box der Thomas Krenn Cluster

Com Career Track: MCITP Windows Server 2008 R2 Enterprise Administrator

Hochverfügbare Virtualisierung mit Open Source

ESET Preisliste gültig ab: 01. Mai 2009

TSM 5.2 Experiences Lothar Wollschläger Zentralinstitut für Angewandte Mathematik Forschungszentrum Jülich

Hubert Schweinesbein Tel / Hubert.Schweinesbein@suse.de

Systemanforderungen für MSI-Reifen Release 7

Aufbau einer Testumgebung mit VMware Server

Diese Anleitung erläutert die Einrichtung des Active Directory Modus im DNS-343.

Umbenennen eines NetWorker 7.x Servers (UNIX/ Linux)

Firma und Internet-Server Projekt

Der Nutzen und die Entscheidung für die private Cloud. Martin Constam Rechenpower in der Private Cloud 12. Mai 2014

Clustering mit Shared Storage. Ing. Peter-Paul Witta

Hochverfügbarkeit mit Windows Server vnext. Carsten Rachfahl Microsoft Hyper-V MVP

KASPERSKY SECURITY FOR VIRTUALIZATION 2015

Linux High Availability out of the Box

DNS Server einrichten unter Debian Linux. DHCP Server einrichten unter Debian Linux. Querschnittsaufgaben.

Kurs für Linux Online Kurs Verwalter des Linux System

Citrix Provisioning Server Marcel Berquez. System Engineer

Benutzerhandbuch für Debian Server mit SAMBA. Rolf Stettler Daniel Tejido Manuel Lässer

Open Source und Sicherheit

Mail Protokolle. ESMTP: Extented SMTP Server gibt Infos über seine Fähigkeiten aus, zb für Verschlüsselung verwendet

EchoLink und Windows XP SP2

Avira Professional / Server Security. Date

Linux Desktop im Kanton Solothurn

Kurzanleitung zur Softwareverteilung von BitDefender Produkten...2

EXCHANGE Neuerungen und Praxis

Fallstudie Nagios bei MIT

Anleitung zur Installation eines Clusters unter VMWare 4.0 (Built 4460)

DNS 323 Wiederherstellung von gelöschten Dateien (bzw. von als in Windows als gelöscht markierten Dateien ) aus einem ext2 Dateisystem

Versuch 3: Routing und Firewall

Grundlagen DNS 1/5. DNS (Domain Name System)

Well-Balanced. Performance Tuning

Kursübersicht act-academy Kloten - 2. Halbjahr 2015

Betriebshandbuch. Installation Fileserver mit Windows 2003 Enterprise Server an der TBZ Technikerschule Zürich

Marcel Oberli Head of Confidence CASSARiUS AG

VMware. Rainer Sennwitz.

IBM Software Demos Tivoli Provisioning Manager for OS Deployment

Backup als Dienst des URZ

Einblick in die VMware Infrastruktur

Clusterinstallation mit FAI

enerpy collaborative webased workflows collaborative webbased groupware INDEX 1. Netzwerk Überblick 2. Windows Server 2008

Sicherheit wird messbar Lösungsansätze und Methoden. Case. 15. September 2009, Hotel St. Gotthard, Zürich

High Performance Computing Cluster-Lösung mit MOSIX im Einsatz bei VA-TECH HYDRO

TCP/IP Teil 2: Praktische Anwendung

Installations-Dokumentation, YALG Team

2 Datei- und Druckdienste

Systemvoraussetzungen Stand

Securepoint Security Systems

Fachbereich Medienproduktion

2. Braunschweiger Linux-Tage. Vortrag über RAID. von. Thomas King Braunschweiger Linux-Tage Seite 1/16

Das Lern-Management System (LMS) StudIP an der Universität Osnabrück

PROFI UND NUTANIX. Portfolioerweiterung im Software Defined Data Center

Das neue Volume-Flag S (Scannen erforderlich)

The Unbreakable Database System

2. Kommunikation und Synchronisation von Prozessen 2.2 Kommunikation zwischen Prozessen

DNS 323 Datenwiederherstellung mit Knoppix (DVD) ab Firmware Version 1.04b84

Panda GateDefender Software eseries ERSTE SCHRITTE

Mai 09 Okt Markus Zack EDV-Kaufmann Hauptstraße Spannberg Mobil: / Mail: markus@zack.co.at.

4. Network Interfaces Welches verwenden? 5. Anwendung : Laden einer einfachen Internetseite 6. Kapselung von Paketen

Hardware- und Softwareanforderungen für die Installation von California.pro

Installation SQL- Server 2012 Single Node

Ihr Benutzerhandbuch SOPHOS ENDPOINT SECURITY

Konfiguration Zentyal 3.3 Inhaltsverzeichnis

Anleitung zur Nutzung des SharePort Utility

Einsparpotenzial für Unternehmen: Stromkosten und CO 2 ganz ohne Komfortverlust

STORAGE. Martin Schmidt Berufsschule Obernburg

Hamnet Einstieg: Technik und Konfiguration des eigenen Zugangs

File Sharing zwischen Mac und PC über Crossover-Kabel

Konfiguration Firewall (Zyxel Zywall 10) (von Gruppe Schraubenmeier)

Portal for ArcGIS - Eine Einführung

HAFTUNGSAUSSCHLUSS URHEBERRECHT

HLx Management Console

Konfigurationsanleitung Network Address Translation (NAT) Funkwerk. Seite Copyright Stefan Dahler Oktober 2008 Version 1.

Automatisierte Einbindung von Windows Systemen in Bacula mit Hilfe von OPSI

Microsoft Azure Fundamentals MOC 10979

Web Space Anbieter im Internet:

Linux Hochverfügbarkeits-Cluster

Hochverfügbarkeit - wie geht das?

Checkliste Systemvoraussetzungen. Systemvoraussetzungen für den Datenbank-Server von MKS Goliath

Max-Planck-Institut für demografische Forschung, Rostock

Transkript:

Computing @ GSI LINUX @ GSI, overview Migration of services growing of the LINUX Batch farm Migration Windows Desktops > XP security: new firewall configuration statefull routing GSI free WLAN DMZ Walter Schoen, GSI

LINUX @ GSI central services (webserver, mailserver,... desktop scientific computing number crunching (batch farm) physics analysis file servers for experiment data some numbers: > 400 LINUX computers about 10 fileservers about 10 groupservers about 10 compute servers Walter Schoen, GSI

Migration of services migration from AIX/Windows > LINUX IMAP server old solution: exchange 5.0 new solution: OCS?, CYRUS?,Exchange2003? mailserver: old solution: sendmail on AIX new solution: postfix on LINUX + Spam Filter + Virusfilter dhcp testing (automatic configuration based on ORACLE DB, migration from Windows to LINUX soon dns testing, migration from AIX to LINUX soon Walter Schoen, GSI

LINUX at GSI: GSI LINUX LINUX cluster: DEBIAN stability easy upgrade Laptops ( stand alone ): SUSE hardware detection easy administration for users... the newest gadgets inside... ; ) servers for commercial software: SUSE enterprise server (required from ORACLE,TSM server) SUSE DEBIAN Walter Schoen, GSI

The GSI LINUX Farm organisation fileserver /usr/local, /data/... groupserver n=1 /usr/bin... client i=1,j=1 /tmp,/var1 groupserver n=2... groupserver... n=k client i=k,j=1 /tmp,/var... client i=1,j=m /tmp,/var client i=k,j=... /tmp,/var Walter Schoen, GSI

LINUX Batch Farm 224 CPU's (in 112 smp computers) 96 cpu PIII, 600 MHz, ATX midi tower 128 cpu Xeon 2.4 Ghz, 19 future: about 100 more CPU' s in pizza box and replacement of the 600 MHz boxes ( space!) by 3 Ghz boxes Walter Schoen, GSI

Windows @ GSI active directory for the new XP clients 2 domain controllers 1 print server (Win2K cluster with 2 nodes) 2 file servers 2 application servers 2 web servers windows2003 servers virus filter McAfee new Windows desktops:windows XP Exchange IMAP server + Groupware Walter Schoen, GSI

Linux based HA server => Talk from K.Miers high availibility system for mission critical services special hardware with redundant power supplies system on hardware RAID I important resources on mirrored RAID Walter Schoen, GSI

Walter Schoen, GSI

Experiment Data on IDE SCSI RAIDs Walter Schoen, GSI

Linux-Ausfallsicherheit für Karin Miers 1 Linux-Ausfallsicherheit für Problemstellung Lösungsansatz Tools Implementierung / Testbetrieb

Linux-Ausfallsicherheit für Karin Miers 2 Problemstellung Gemeinsames /usr/local auf einem - Server für alle Clients Ausfall des -Servers: Arbeit steht Stale Mounts Server /usr/local/ Client 1 /usr/local/ Client 2 /usr/local/ Client 3 /usr/local/ USW.

Linux-Ausfallsicherheit für Karin Miers 3 Lösungsansatz 2 identische Server mit Hot-Standby: individual disks shared disk Server Server Server A Server B Server A Server B /usr/local/ /usr/local/ /usr/local/ Client 1 Client 2 Client 3 Client 1 Client 2 Client 3 /usr/local/ /usr/local/ /usr/local/ USW. /usr/local/ /usr/local/ /usr/local/ USW. Problem: Synchronisation des Dateisystems

Linux-Ausfallsicherheit für Karin Miers 4 Linux-Tools heartbeat drbd mon Gegenseitige Überwachung der Server Starten der Dienste Synchronisation des Dateisystems (/usr/local) Systemüberwachung

Linux-Ausfallsicherheit für Karin Miers 5 heartbeat Wie weiß der Backup-Server, wenn der Master versagt? Beide kommunizieren über Ethernet und die serielle Schnittstelle (beides wegen Redundanz) und tauschen in regelmäßigen Abständen Nachrichten aus (Herzschlag). Wenn diese Nachrichten ausfallen, dann ist der Rechner ausgefallen. Der Backup-Server startet den -Dienst.

Linux-Ausfallsicherheit für Karin Miers 6 heartbeat Server 1 eth0 ttys0 hallo -> <- hallo hallo -> <- hallo Server 2 eth0 ttys0 Normalbetrieb: Server 1 - Master für Service B Server 2 - Master für Service A Service A Service A Service B Service B Server 1 Server 2 Fehlerfall: Server 2 fällt aus heartbeat- Antwort bleibt aus Server 1 übernimmt Service A eth0 ttys0 Service A Service B hallo -> hallo -> eth0 ttys0 Service A Service B

Linux-Ausfallsicherheit für Karin Miers 7 drbd Distributed Replicated Block Device Kernelpatch für eine Zwischenschicht für Block-Devices über diese Schicht Spiegelung von Partitionen über das Netzwerk im Prinzip: ein RAID-1 Verbund über das Netzwerk

Linux-Ausfallsicherheit für Karin Miers 8 Funktionsweise drbd Server1 Server2 Dateisystem Dateisystem DRBD TCP/IP TCP/IP DRBD Disc Treiber NIC Treiber NIC Treiber Disc Treiber Netzwerk Festplatte Festplatte

Linux-Ausfallsicherheit für Karin Miers 9 Implementierung lxha02 ttys0 eth0 HW-raid5, ~250 GB / /var /usr /tmp /drbd /drbd/var/lib/nfs eth1 heartbeat drbd lxha03 eth0 ttys0 HW-raid5, ~250 GB / /var /usr /tmp ln eth1 /drbd /drbd/var/lib/nfs /drbd/usr/local /drbd/usr/local client1 lxha01 /usr/local : lxha01:/drbd/usr/local

Linux-Ausfallsicherheit für Karin Miers 10 mon Service Monitoring Daemon: Ressourcen-Monitoring Netzwerkverfügbarkeit Serverprobleme Umgebungsvariablen (z. B. Temperatur) Überwachung erfolgt mit individuellen Skripten Im Fehlerfall wird eine Aktion getriggert (Mail, Restart...)

Linux-Ausfallsicherheit für Karin Miers 11 Wozu ein Monitoring-Tool für heartbeat? Heartbeat prüft, ob der andere Server lebt. Es überwacht nicht den Service selbst. Mögliche Fehlerfälle: heartbeat fällt aus, der Service nicht beide heartbeat-verbindungen unterliegen einem Hardwaredeffekt Master-Server fällt teilweise aus ein Service fällt aus, heartbeat nicht

Linux-Ausfallsicherheit für Karin Miers 12 Monitoring des Systems Network ping.monitor? ok! mon mon.cf... rpc.monitor? ok! Überwachungsskripte: rpc.monitor ping.monitor heatbeat.monitor... heartbeat heartbeat.monitor? no reply or error restart.alert Alertskripte: mail.alert log.alert restart.alert... mail.alert administrator@gsi.de