Impressum & Organisatorisches
|
|
- Christoph Braun
- vor 8 Jahren
- Abrufe
Transkript
1 Impressum & Organisatorisches Vorlesung Basierend auf: Blueprints for High Availability von Evan Markus und Hal Stern Evan Markus -> Veritas Hal Stern -> Sun - ziemlich umfassend Script & Vorlesung von: Tomas Pospisek tpospise@hsz-t.ch Script und Unterlagen unter: 1
2 Impressum & Organisatorisches Lesung -> Fragen -> Diskussion -> Pause Übung -> Diskussion -> Papier -> Compi? Kursverlauf je nach Interesse Knoff-Hoff des Dozenten vs. der Teilnehmer -> Diskussion, Beiträge 2
3 Impressum & Organisatorisches Danke für Beiträge - Luas Valle, SAN KnowHow, Diagram 3
4 1: Intro Redundanzmöglichkeiten? Fehler? Fallback Szenarien? Was sollen diese Vorlagen? Was ist das Zielpublikum? Was weiss es schon? -> HA!!! :-) HA = High Availability = Hohe Verfügbarkeit 4
5 1: Intro Was ist unser Ziel: einen Dienst (Service) anzubieten und zwar so zuverlässig wie möglich. Messkriterium für unseren Erfolg ist die Verfügbarkeit (Availability) des Dienstes in % (100% == immer verfügbar, 50% == Hälfte der Zeit) 100% in der Praxis unerreichbar gut wären 99% oder 99.9% oder 99.99%... wie viele 9en hätten Sie den gern? 5
6 1: Intro HA ist keine Lösung die man einfach einkaufen und installieren kann bevor man HA macht: - Dienst so implementieren, dass HA gar nicht erst nötig ist! - Ausfallszeit (downtime) bewerten: was kostet es, wenn der Dienst nicht verfügbar ist? - was geht verloren? - wieviel kann man sich leisten für den Schutz vor Dienstausfall auszugeben? HA ist ein fortlaufender Prozess! Testen!!! 6
7 1: Intro Verfügbarkeits-Index 1 Basic System: es hat Backups aber keinen HA Plan und nix 2 Redundant Data: RAID5 o.ä. 3 System Failover: Redundante Server 4 Disaster Recovery: Komplette Infrastruktur Spiegelung 7
8 1: Intro Überblick Kapitel 2 Kapitel 3 Kapitel 4 Kapitel 5 Kapitel 6 Kapitel 7 Kapitel 8 Kapitel 9 Kapitel 10 Kapitel 11 Kapitel 12 Kapitel 13 Kapitel 14 Kapitel 15 Kapitel 16 Kapitel 17 Kapitel 18 Kapitel 19 (Kapitel 20 Was ist Verfügbarkeit? Fehler-Ebenen Kosten von HA TODO: Politics of HA Designprinzipien für HA (und allgemein) Systeme - Backups Daten-Speichern SAN, NAS & Virtualisierung Netzwerke Datenzenter & Umgebung Menschen & Prozesse - Klienten & Konsumenten - Anwendungs-Zuverlässigkeit Daten & Web Services - Lokales Clustern & Failover - Failover Verwaltung & Probleme - Failover Konfiguration - Daten Replizierung - Virtuelle Maschinen & Ressourcen Verwaltung - Disaster Recovery) 8
9 2: Was ist Verfügbarkeit Wie misst man Verfügbarkeit? Arten/Ebenen von Fehlern Resiliency (Strapazierfähigkeit, Zähigkeit, Belastbarkeit) Resilient System: - mögliche Fehlerzustände bekannt - Lösungen bekannt - Ausfallszeiten quantifizierbar 9
10 2: Verfügbarkeit Messen 10
11 2: Verfügbarkeit Messen Strato AG 99% Verfügbarkeit garantiert Marktführer? Mio Domains 3 TB EMC SAN 2 Wochen Ausfall live Reparatur und Tests in Produktion kein Backup (?) 7'000 Sites verloren 60% der Kunden geben an, sie wollen der ISP wechseln Kaputter SCSI Kontroller? 11
12 2: Verfügbarkeit Messen sind 99% Verfügbarkeit OK? 99% entspricht 1:41h Ausfall/Woche - kommt darauf an wann & wie verteilt! - Anforderungsdefinition! mit Failover: 2 Server à 99% ( primo, secondo ) -> theoretisch ist secondo während dem 1% Ausfallszeit von primo 99% verfügbar -> Totale Verfügbarkeit = (0.1 * 0.99) = 99.99% - in der Praxis? 12
13 2: Verfügbarkeit Messen jede Stufe in der vorhergehenden Tabelle bedeutet Kosten von 5-10 Mal der vorhergehenden Stufe, wobei der Faktor von Stufe zu Stufe wächst Wie wird Downtime definiert? Benutzer kann seine Arbeit nicht zeitig erledigen 13
14 2: Verfügbarkeit Messen Ursachen von Downtime 14
15 2: Verfügbarkeit Messen Ursachen von Downtime Best in class MVS applications running on Parallel Sysplex had application availability levels between 99.9 percent and percent. Best in class distributed client/server applications running across a Unix environment (and sometimes across MVS as well) had availability levels of 99.6 percent. Best in class application availability in an NT environment was around 99 percent Gartner Group,
16 2: Verfügbarkeit Messen Ursachen von Downtime bei Web Applikationen aus Causes of Failure in Web Applications, Soila Pertet und Priya Narasimhan, Dez. 2005, 16
17 2: Verfügbarkeit Messen Statistiken zeigen z.t. sehr unterschiedliche Resultate, bzw. Gewichtungen der einzelnen Ursachen Kosten von Ausfällen nicht eindeutig: - entgangene Einnahmen? - Produktivitätseinbusse? - direkte Kosten: Haftung für Service Qualität - Ruf/Image? -... bei welchen all dieser Ursachen ist es effektiv/effizient diese abzudecken? welche sind sinnvoll abzudecken? ist es möglich diese abzudecken? wieviel bringt's? 17
18 2: Verfügbarkeit Messen Ursachen von Downtime Geplanter Ausfall - SW Upgrade Lösungmöglichkeit mit Failover Rolle wechseln, upgraden. Effizient? - HW Erweiterung oft pluggable Menschen: - Fehler! Ausbildung, KISS, klare Prozesse HW: - beinhaltet auch Stromausfall SW:
19 2: Verfügbarkeit Messen Was ist Verfügbarkeit? MTBF A = (in %) (MTBF + MTTR) MTBF = Mean Time Between Failures MTTR = Mean Time To Repair MTBF bezogen auf service life (3-5J für HDs) 19
20 2: Verfügbarkeit Messen Was bedeutet z.b %? SCSI Laufwerke (2004): ~ 1'200'000 h ~ 160 Jahre! Garantie jedoch nur 5 Jahre! SATA IDE Laufwerke (2004): ~ 600'000-1'200'000 h 1'200'000 = 0.99'9999 -> MTTR = 1.2h! 1'200'00 + MTTR guter CPU Lüfter: 50'000 h ~ 6 Jahre -> MTTR = 3 min Quelle: erste Seite Google: SCSI Fan MTTR 20
21 2: Verfügbarkeit Messen M is for Mean Schnitt, jedoch Standardabweichung, Verteilung? - Lebensdauer: 1, 1, 1, 1, 46 ergibt Mittel von Erwartungen der Benutzer entsprechend setzen: - wenn effektiv 20 min für eine Reparatur nötig sind, ist es besser den Beutzern 1h anzugeben anstatt 10 min. Ruf bei Kunden/Öffentlichkeit kann auch bei objektiv sehr guter Verfügbarkeit einen grossen Schaden nehmen, wenn der Ausfall in einem schlechten Moment passiert 21
22 2: Ausfallsmodi Hardware v.a. bewegliche oder komplexe Teile, Teile mit engen Toleranzen, hohe Geschwindigkeiten: - HDs - Bänder - Lüfter Stromversorgung: - fällt abrupt aus oder - fällt unmerklich, langsam, graduell aus 22
23 2: Ausfallsmodi Hardware (ff) sowohl schlecht funktionierende Lüfter als auch sich graduell verschlechternde Stromversorgungen können sehr ekelhaft sein -> bewirken kuriose, nicht nachvollziehbare oder sehr unregelmässig auftretende Ausfälle - beide haben die tiefsten MTBF auf Computersystemen - sind deswegen oft doppelt oder mehrfach ausgelegt - haben z.t. call home Funktionalität 23
24 2: Ausfallsmodi Umgebungs- und physikalische Ausfallursachen System-externe Faktoren oft unterbewertet teilweise Standby System nutzlos, da ganze Umgebung betroffen ist Stromausfälle, Brownouts Kühlung/Luftaufbereitung Feuerlöschsystem Feuer etc. 24
25 2: Ausfallsmodi Netzwerk-Ausfälle sehr viele Komponenten beteiligt die meisten nicht unter eigener Kontrolle - Netzwerk-Administration oft von System Administration getrennt - Upstream etc. DOS / Eindringlinge Viren 25
26 2: Ausfallsmodi DB-System Ausfälle DBs komplex bestehend aus diversen internen Subsystemen DB stürzt ab DB hängt Ressourcen gehen aus DB Index korrupt SW Fehler 26
27 2: Ausfallsmodi Web-Server Ausfälle rel. junge Software schnelle Entwicklung komplex Benutzer wechselt zu anderem Anbieter File & Printserver Ausfälle Basis vieler SW 27
28 2: Vertauenswürdigkeit der Messungen Erneuerbarkeit oft nach Reparatur höhere Wahrscheinlichkeit eines weiteren Ausfalls wenn dem nicht so ist, sind berechnete MTBF's vertrauenswürdiger periodische Reboots versuchen MTBF zu reduzieren 28
29 3: Der Wert von Verfügbarkeit Direkte Kosten von Downtime verlorene Benutzerproduktivität verlorene Aussenstellen-, Berateraufträge überzogene Termine keine Auslieferung möglich entgangene Aufträge SLAs 29
30 3: Der Wert von Verfügbarkeit Indirekte Kosten von Downtime Kundenzufriedenheit schlechter Ruf, PR,.. Aktienpreis Haftung Mitarbeiterzufriedenheit 30
31 3: Der Wert von Verfügbarkeit TODO Wert von Verfügbarkeit S = R n Rv S = Ersparnis Rn = Ausfalls-Risiko (Kosten) nach Verbesserung Rv = Ausfalls-Risiko (Kosten) vor Verbesserung ROI = S/Kv ROI = Return On Investment Kv = Kosten der Verbesserung 31
32 3: Kosten/Risiko Abwägung Stufen der Verfügbarkeit 1. Stufe: reguläre Verfügbarkeit Probleme lösen sobald sie auftauchen 2. Stufe: erhöhte Verfügbarkeit Datenschutz -> Datenspiegelung, RAID etc. 32
33 3: Kosten/Risiko Abwägung Stufen der Verfügbarkeit (ff.) 3. High Availabililty Redundante Server -> Cluster womöglich alles doppelt 99.98% und mehr erreichbar Netzwerkdesign Support Systeme System & Netzwerkadministration einbezogen Audit, um sicher zu stellen, dass alle Eventualitäten berücksichtigt wurden (-) Komplexität (-) Flexibilität (-) Verwaltung wird schwieriger (-) Kosten 33
34 3: Kosten/Risiko Abwägung Stufen der Verfügbarkeit (ff.) 4. Disaster Recovery Infrastruktur an mehreren Orten gespiegelt Prozeduren für Umzug Wer macht was Verantwortlichkeiten und Stellvertreter SA & NA an mehreren Orten etc. 34
35 3: Kosten/Risiko Abwägung Stufen der Verfügbarkeit (ff.) Fehlertollerante Systeme System selbst ist komplett redundant oder mehrfach aufgebaut Fehler werden mittels Mehrheitsentscheidungen erruiert fehlerhafte Komponenten vom System isoliert theoretisch kein Hardware bedingter Ausfall möglich sehr teuer basieren oft auf bewährten Komponenten 35
36 3: Kosten/Risiko Abwägung Abwägen von Risiken und Chancen Komponenten schützen, die: am häufigsten ausfallen am schwersten zu ersetzen sind: - sowohl bzgl. Marktverfügbarkeit - als auch praktisch -> am besten Komponenten verbauen, welche lange halten und einfach zu ersetzen sind! bei Ausfall den grössten Einfluss haben - intelligente Komponenten verwenden, welche auf Ausfälle reagieren können: - Ventilator fällt aus -> System fährt runter Daten zuerst schützen, Zugang zu Daten als nächstes 36
37 3: Kosten/Risiko Abwägung Die wichtigsten Punkte: Komponenten können ausfallen. Dies sollte entsprechend berücksichtigt und geplant werden Vorsicht vor Durchschnittswerten, Maximalwerte sind besser: - längste Ausfallsdauer, die man verkraften kann - worst-case Zeit um ein Problem zu beheben Sowohl Schutz als auch Downtime kosten Geld -> abwägen 37
38 4: Politics of Availability TODO 38
39 4: Politics of Availability Problematik dem Management nahebringen Kosten (direkt/indirekt) berechnen verschiedene Stufen von Verfügbarkeit erklären Bild umfassend anschauen, komplette Szenarios planen Vorschläge für Problembehebung Risiken evaluieren, welche man eingehen sollte: - effektivste Risikoverminderungen - am wahrscheinlichsten eintreffend Empfehlungen machen und begründen/belegen aufzeigen, dass es eine schlechte Idee ist erst aus Erfahrungen zu lernen 39
40 5: 20 grundlegende Design-Prinzipien #20: Geld ausgeben, aber nicht blindlings Qualität kostet Prioritäten setzen Return on Investment #19: Nichts voraussetzen keine out of the box HA! Situationen definieren und austesten sicherstellen, dass alle Beteiligten Problematik überblicken -> Ausbilden 40
41 5: 20 grundlegende Design-Prinzipien #18: Single Point Of Failure entfernen schwächstes Glied der Kette Iteration #17: Streng auf auf Sicherheit achten Datenkorruption verhindern #16: Server Kosolidieren weniger Teile jedoch: Isolation? 41
42 5: 20 grundlegende Design-Prinzipien #15: Häufige Aufgaben automatisieren weniger Fehler #14: Änderungs-Kontrolle Einhalten alle relevanten Gruppen sollten Änderung & Zeitplan absegnen Risiken angeben, Rückzugsstrategie 42
43 5: 20 grundlegende Design-Prinzipien #13: Alles Dokumentieren Audit Trails Guides Dokumentieren für: - SA selbst: was, warum, wie? - Nachfolger/Mitarbeiter - Management schlechte Doku ist schlimmer als keine - während Stresssituation wird Doku blindlings gefolgt Book of Evan : Tradition, dass abgehende Mitarbeiter letzte 2 Wochen alles für Nachwelt dokumentieren Offline speichern 43
44 5: 20 grundlegende Design-Prinzipien #12: Service Level Agreements welche Verfügbarkeitsstufen? Verfügbarkeits-Zeiträume: welche kritisch? wo, wie verfügbar? Prioritäten (wer, wo zuerst im Fall der Fälle) Eskalations-Reihenfolge #11: Vorausplanen Ausnahmezustände und Krisen vorausplanen Unbekannte Situation planen: Zuständigkeiten - Alternative ist alles sofort jetzt flicken wenn's brennt -> Chaos offline dokumentieren 44
45 5: 20 grundlegende Design-Prinzipien #10: Alles Testen Krisen Pläne Applikationen OS HW alle Änderungen: HW/SW/Prozeduren Tests in so Produktions-ähnlichen Umgebungen wie möglich wenn möglich von Usern auf allen Ebenen testen, Ende-zu-Ende Tests regelmässig wiederholen 45
46 5: 20 grundlegende Design-Prinzipien #9: Separate Umgebungen unterhalten Netze Computer User 1. Produktion Änderungen nur unter kontrollierten Bedingungen alles muss zu jeder Zeit funktionieren wenn etwas nicht funktioniert muss es einen Weg geben zu einer Version zurückzukehren, die funktionierte Änderungen müssen reibungslos, ohne Unterbrechung durchgeführt werden 46
47 5: 20 grundlegende Design-Prinzipien #9: Separate Umgebungen unterhalten (ff) 2. Produktions-Spiegel Kopie der Produktion für Rollback Spiegel wird erst upgedated, wenn bewiesen ist, dass die Produktion korrekt funktioniert (Regressions-Tests?) 47
48 5: 20 grundlegende Design-Prinzipien #9: Separate Umgebungen unterhalten (ff) 3. Quality Assurance Testumgebung für Applikationen welche als produktionsreif angesehen werden kontrollierte Änderungen 4. Entwicklung kann fehlerhaft sein 5. Labor Freestyle, Spielwiese 6. Disaster Recover Räumlich weit von den anderen entfernt 48
49 5: 20 grundlegende Design-Prinzipien #8: Geschichte des Systems überwachen Aufzeichnungen behalten MTTR notieren wie verbessern? was war Ursache des Ausfalls? häufige Probleme zuerst angehen 80/20 Faustregel: - 80 % der Probleme aufgrund von 20% der Ursachen 49
50 5: 20 grundlegende Design-Prinzipien #7: Wachstum einplanen Gesetz von Boyle-Mariotte : Gas dehnt sich aus bis es den ganzen Raum auffüllt entsprechend planen 50
51 5: 20 grundlegende Design-Prinzipien #6: ausgereifte SW einsetzen Know How Benutzerbasis Support jedoch Open Source: - grosse Benutzerbasis - viele Entwickler - einfach zu erhalten - einfach Fehler zu beheben #5: zuverlässige und einfach wartbare HW einsetzen Ersatzteile verwalten alternative Zulieferer haben 51
52 5: 20 grundlegende Design-Prinzipien #4: Konfigurationen wiederverwenden 3 oder 4 Konfigurationen (klein, gross, mittel) einfacherer Support: - weniger HW/SW Permutationen - weniger zu lernen - weniger kann kaputt gehen vorgetestete Konfigurationen: - mehr Vertrauen - zuverlässiger - Einsatz neuer Maschine kann einfacher gerechtfertigt werden - nur Unterschiede müssen getestet werden Einkaufen in grossen Mengen weniger Ersatzteile 52
53 5: 20 grundlegende Design-Prinzipien #3: externe Ressourcen nutzen jemand hat (fast) jedes Problem schon gelöst - Skripts - Google... Berater unabhängige aber v.a. Hersteller - sicherstellen dass Know-How Transfer stattfindet! Trainingsangebote (der Hersteller) nutzen #2: ein Problem -> eine Lösung Werkzeuge nicht in etwas reinmurksen #1: KISS Mehrdeutigkeit aus System entfernen 53
54 6: Backup und Restore grundlegende Regeln für Backups die wichtigste Aufgabe für HA Spiegelung ersetzt Backups nicht (Datei gelöscht...) die häufigste Verwendung von Restores ist nicht nach einer Katastrophe regelmässig Restores versuchen Laufwerksköpfe sauber halten MTBF von Bändern beachten: - gute Backup Software wird Anzahl Zugriffe berücksichtigen und dem Benutzer Nachricht geben, wenn er neue Bänder kaufen soll Qualität der Bänder sinkt mit der Zeit zwei Kopien von kritischen Bändern machen off-site lagern 54
55 6: Backup und Restore Kommerzielle SW 100% HW Ausnutzung Hot Backups: - DBs, FSs offenes Band-Format: - Bänder auch ohne SW lesen - keine Lizenz-Schlüssel nötig um Bänder zu lesen Geschwindigkeit zentralisierte Verwaltung Zuverlässigkeit: kein SPOF schnelle Disaster Recovery: - kein Neuerstellen der Indices HW Unterstützung & Flexibilität - existierende HW wird unterstützt 55
56 6: Backup und Restore Kommerzielle SW (ff) ausgereifte Produkte mit Referenzen Medien Verwaltung: - Labeling - Barcode Verwaltung - off/onsite Medien - Wechsler Backup Leistung langsamstes Glied besseres Netz, mehr Interface Karten etc. direkt an grosse HDs anschliessen mehrere Laufwerke 56
57 6: Backup und Restore Hot Backups (auch von DBs) optimal: keine Unterbrechung Konsistenz Zwischencache für Daten damit sich diese während Backup nicht ändern DB writelock Dateien bei NT sind gelockt, wenn diese offen sind Unix -> mehrere Durchgänge über FS FAM/inotify Weniger Daten, schnellere Backups, weniger Platzverbrauch hierarchische Speicher-Verwaltung nicht verwendete Daten in Archive auslagern 57
58 6: Backup und Restore Mehr HW verwenden off-host Backup : Disks direkt auf Tape Third-Mirror Breakoff Backup direkt auf Disk: jedoch Backup auf Tape schneller Fortgeschrittene SW Features Copy-On-Write Schnappschüsse Schnappschusszeit festlegen danach werden überschriebene Blöcke auf die Seite getan, damit man den festgehaltenen Zustand Backupen kann 58
59 6: Backup und Restore Gemultiplexte Backups mehrere Backups gleichzeitig auf ein Band Schnelle & Flash Backups dd if=/dev/hda of=/dev/st0 59
60 6: Backup und Restore Backup Bänder & Daten Verwalten physischen Zugang zu Bändern beschränken Bänder magnetisch löschen, bevor sie weggegeben werden Übermittlung von Backupdaten verschlüsseln keine unerlaubten Benutzer-Restores erlauben Bänder, welche Firma verlassen, schützen Bänder nicht offsite lagern (MTTR wird grösser) Sicherheit und schnellen Zugriff abwiegen jedes Band beschriften Barcodes verwenden 60
61 6: Backup und Restore Restores schnellerer Restore <-> langsamerer Backup schnellerer Restore: - weniger inkrementelle Backups - Bänder erreichbar halten -> MTTR - schnellsten Pfad verwenden (Disk->Band) - am besten gar nicht Restores machen (online Snapshots) Speicheranforderungen für Restores Achtung: Restores können mehr Daten als Speicherplatz enthalten (alte Dateien) gute SW wird gelöschte Dateien nicht wiederherstellen 61
62 6: Backup und Restore die wichtigsten Punkte Backups sind die letzte Verteidigungsline -> Priorität! zuverlässige SW Zeitfenster beachten (reicht Zeit zwischen Backups überhaupt aus?) HDs sind kein Ersatz für Bänder hat die SW die Features, die man braucht? 62
63 7: Hochverfügbare Datenverwaltung HDs sind die kritischsten Komponenten eines Computersystems? 63
64 7: Hochverfügbare Datenverwaltung HDs sind die kritischsten Komponenten eines Computersystems Fundamentale Wahrheiten 1. HDs sind die Komponenten welche am wahrscheinlichsten Ausfallen mehr Disks als andere Komponenten in Computersystemen Grobschätzung bei 100 Disks à 1'200'000h MTBF (2004): - 1'200'000 / 100 => mit 50% Wahrscheinlichkeit fällt nach 2 Jahren die erste aus - 200'000 (1996) 2. HDs enthalten Daten 3. Daten müssen geschützt werden 4. Datenzugang muss gesichert werden 64
65 7: Hochverfügbare Datenverwaltung Über MTBF von HDs MTBF von Hersteller via beschleunigte Alterung von rel. kleinen Populationen oder zurückgegebenen Geräten berechnet problematisch (Einsatz? Produktionslast?) MTBF basierend auf service life Disk Temperatur und Last kein eindeutiger Einfluss auf MTBF Ein-/Ausschalten sehr schwacher Einfluss Alterungsverhalten unterschiedlich zwischen Modellen wenn (SMART-)Fehler auftreten HD wechseln HDs fallen aber häufig (56%) ohne SMART Fehler aus Quellen: [Google Labs], [StorageReview.com] 65
66 7: Hochverfügbare Datenverwaltung Entscheidungsgrundlage für den Aufbau einer hochverfügbaren Lösung ist das folgende hierarchische Datenspeicher-Modell: 1. physische Festplatten 2. Hardware RAID - verfügt üblicherweise über ein Management Tool 3. Software RAID/Volume Management - läuft im oder sehr nahe am OS 4. Filesystem oder Raw Device - ist die Schicht, mit der die Applikation spricht 5. Applikation / DB 66
67 7: HD und Verbindungs-Terminologie SCSI Small Computer Systems Interface Bandbreiten 3MB/s-640MB/s 50 bzw. 68 pin Käbel max. Kabellängen 6-25m Busbreiten: - Narrow: 8 bit - Wide: 16 bit - Ultra: 32 bit Protokolle: single-ended, differential Generationen: SCSI-1, SCSI-2, SCSI-3 Heute: SCSI-3 (Ultra SCSI), v.a. differential - Wide-Ultra SCSI: 40MB/s - Ultra-2 SCSI: 40-80MB/s - Ultra-3/Ultra160: 160MB/s - Ultra320,640: 320,640MB/s 67
68 7: HD und Verbindungs-Terminologie SCSI Small Computer Systems Interface (ff) SCSI sollte während Gebrauch nicht ausgesteckt werden -> Datenverlust braucht Terminator auf beiden Seiten des Kabels/Busses - System terminiert per default eine Seite - einzelnes Gerät am Bus -> Terminierung hinzufügen - mehrere Geräte -> keine Terminierung Anzahl der Gültigen Geräte-Adressen auf einem Bus = Busbreite -1 Hostadapter auf SCSI Bus hat traditionel #7 zwei Arten von Geräten werden unterschieden: - Target - Initiator (Computersystem) mehrere Initiatoren auf einem Bus möglich 68
69 7: HD und Verbindungs-Terminologie Fibrechannel bis zu 2GB/s ca. 16Mio Geräte am FCAL Netz bis zu 80km Distanz Router, Hubs, Switches Geräte sind elektrisch unabhängig -> können ausgesteckt werden, ohne dass dies Einfluss auf andere Geräte am Bus hat benutzt SCSI Protokol SAS Serielles SCSI hotplug fähig point-to-point keine Terminatoren grosse Anzahl von Endgeräten (> 16384) bis zu 6GB/s momentane Entwicklungsrichtung 69
70 7: HD und Verbindungs-Terminologie iscsi über Ethernet TODO 70
71 7: HD und Verbindungs-Terminologie Multihosting Gerät an zwei Systemen angeschlossen typischerweise kann jedoch nur ein System schreiben Failover Multipathing 1 Host erreicht eine Disk oder ein Diskarray über verschiedene Pfade mehr Durchsatz JBOD Just a bunch of Disks ohne HW-Intelligenz zwischen den Disks 71
72 7: HD und Verbindungs-Terminologie Hot-pluggable/Hot-swappable Disks d.h. während regulärem Betrieb keine Downtime für Host oder andere Disks Warm-pluggable Disks d.h. bei angeschaltetem Gerät jedoch ohne Daten-Verkehr nur einige Disks sind von Wechsel betroffen Hot-spares sind als Reserve ans System angeschlossen sobald Disk ausfällt werden mittels HW oder SW die Daten auf dem Hot-spare rekonstruiert 72
73 7: HD und Verbindungs-Terminologie Write-Cache schneller ohne Batterie-Backup -> Datenkorruption bei ACID über mehrere Systeme problematisch -> Synchronization SAN Storage Area Network Speicherpool auf den verschiedene Hosts zugreifen können intern RAID Speicher kann zwischen verschiedenen Hosts aufgeteilt werden zentralisierte Allokation & Verwaltung eingebaute Belasbarkeit & Hochverfügbarkeit Multipath 73
74 7: HD und Verbindungs-Terminologie SAN Storage Area Network (ff) Infrastruktur kann verteilt werden: - dank 2km Limit müssen weder Disks noch Server am gleichen Standort sein intelligentes & effizientes Failover: - N:1, N:N, kaskadiert, Service-Level Failovers effizienter Ressourceneinsatz - z.b. teuere Bandlaufwerke für alle erreichbar Backups ohne LAN Belastung Heiliger Gral des Datenmanagements: - heterogener Datenzugriff möglich 74
75 7: HD und Verbindungs-Terminologie SCSI vs. Fibrechannel FC ist in komplexen Konfigurationen: billiger einfacher zuverlässiger 75
76 7: HD und Verbindungs-Terminologie RAID HW SW -> CPU Belastung RAID basiert auf verschiedenen Stufen von Datenredundanz RAID-0: Streifen (Striping) Speicherplatz wird in Streifen aufgeteilt und diese Streifen sequentiell auf Platten verteilt mehrere Disks, evtl. mehrere Kontroller höherer Durchsatz Verfügbarkeit sinkt! 76
77 7: HD und Verbindungs-Terminologie RAID-1: Spiegelung (Mirroring) nicht nur auf 2 Platten limitiert! - bei mehr als 2 können überzählige Platten als Produktions-Daten für Entwicklung oder QA oder Disaster Recovery verwendet werden oft keine Master/Slave Beziehung: - Lesen von beiden Platten prallel 77
78 7: HD und Verbindungs-Terminologie RAID-1: Spiegelung (Mirroring) (ff) Backup -> Schutz vor Benutzer-Fehler RAID -> Schutz vor Ausfall (+) Schutz (+) schneller (-) teuerer (keine Skaleneffekte, 100% teuerer) (-) Resynchronization teuer: - Zeit - Durchsatz leidet während Resynchronization (-) Schreibzugriff langsamer 78
79 7: HD und Verbindungs-Terminologie RAID-0-1, 1-0, und 0-1 sind nicht identisch! 1-0 oft auch als 10 bezeichnet jedoch Vorsicht! 10 könnte eine integrierte Lösung sein! wir gehen davon aus, dass jede RAID Stufe eine Abstraktion für die nächste Stufe bedeutet 79
80 7: HD und Verbindungs-Terminologie RAID 0-1 (gespiegelte Streifen) d.h. die RAID-0 Stufe stellt für den Spiegelungs-Mechanismus eine virtuelle Platte dar wenn eine Platte in einem RAID-0 ausfällt ist somit die gesammte, von der RAID-0 Stufe exportierte virtuelle Platte unbrauchbar das Wiederherstellen einer defekten Seite eines RAID-1 Spiegels erfordert also das Wiederherstellen aller Platten innerhalb des RAID-0 wenn eine Platte in der Kopie ausfallen sollte ist das gesamte System ausgefallen 80
81 7: HD und Verbindungs-Terminologie RAID 1-0 (gestreifte Spiegel) die RAID-1 Stufe exportiert 2 gespiegelte Platten als eine virtuelle der RAID-0 Mechanismus nimmt diese virtuelle Platte und verbindet sie mit weiteren virtuellen Platten, wodurch eine grosse, von der RAID-0 Stufe exportierte Platte entsteht wenn eine Platte ausfällt, sondert der RAID-1 Mechanismus, diese ab. Dadurch wird nicht mehr auf die Platte zugegriffen. Der Rest des Gesamtsystems ist davon nicht betroffen. sobald die defekte Platte ersetzt wird muss nur diese von der Kopie wiederhergestellt werden das System verkraftet einen weiteren Ausfall einer Platte, mit Ausnahme der einen verbleibenden Kopie Nachteil von 1-0 ist, dass man jeweils Paare von gleich grossen Platten haben muss. 81
82 7: HD und Verbindungs-Terminologie RAID-2: Hamming Encoding jedes Wort wird über mehrere Disks verteilt zusätzlich gibt es ECC Disks bei kleinen Worten -> viele ECC Disks nur so schnell wie die langsämste Disk grosse Bandbreite keine kommerzielle Implementation 82
83 7: HD und Verbindungs-Terminologie RAID-3, 4, 5: Parity RAID Daten werden in Blöcke unterteilt und diese Blöcke über die Disks gesteift eine Platte enthällt Block Parität (XOR aller Streifen eines Blocks) eine ausgefallene Platte kann neu errechnet werden jede Platte muss gleich gross sein Schreibvorgang ist langsam, da immer Parität aus allen Streifen errechnet werden muss Wiederherstellung einer Disk ist teuer 83
84 7: HD und Verbindungs-Terminologie RAID-3: Block in Streifen Ein zu schreibender Block wird in n Streifen aufgeteilt. Jeder Streifen wird auf die entsprechende Platte geschrieben. Letzte Platte enthällt Parität. jeder Diskzugriff berührt alle Platten kleine random-access Schreibzugriffe sind langsam HW Systeme haben Cache RAID-4: Paritätsblock auf dedizierter Platte ein Block pro Platte letzte Disk enthällt nur Parität entsprechend hat diese Platte den grössten Verschleiss Paritätsplatte ist bei Schreibzugriffen Flaschenhals HW Systeme haben Cache 84
85 7: HD und Verbindungs-Terminologie RAID-5: Parität verteilt über alle Platten kein Flaschenhals 85
86 7: HD und Verbindungs-Terminologie HW RAID beeinträchtig den Host nicht die virtuelle Disk sieht genau wie ein logical Unit (LUN) aus sowohl stand-alone als auch intern (+) Leistung (+) Disk Cache -> Leistung - readahead (+) advanced Features: - Wide Area Data Replication - Disks die zwischen mehreren Hosts geteilt werden können (-) beschränkt auf ein Diskarray (-) schwierig Array umzukonfigurieren oder Grösse zu verändern 86
87 7: HD und Verbindungs-Terminologie HW RAID (ff) (-) (-) (-) kein standard Management Interface evtl. Beschränkungen (Grösse des Arrays, Anzahl LUNs,...) Vendor Lock-In (-) SPOF - Trafo - Kühlung - Stromkabel - Sicherung - interne Disk Kontroller - Cache Batterie - Backplane - Stromschalter - Gehäuse 87
88 7: HD und Verbindungs-Terminologie Disk Arrays JBOD Schrank + Intelligenz (Oberbegriff von NAS und SAN) haben meist Cache fahren intern RAID weitere mögliche Features: Wide Area Data Replication - normal ist Remote read-only intelligente Busse - können automatisch Host isolieren parallele Busse - single Host via verschiedene Busse - höherer Durchsatz - Fallback 88
89 7: HD und Verbindungs-Terminologie Disk Arrays (ff) weitere mögliche Features (ff) Verbindung zu vielen Hosts auf einmal -> SAN hot pluggable Disks hot Spares read-ahead Buffer können intern Kopien von virtuellen Laufwerken machen -> gut für QA, Entwickler etc. komfortable Speicheradministration - einbindbar in Management Systeme phone home 89
90 7: HD und Verbindungs-Terminologie Software RAID (+) flexibel (-) bei Parity RAID -> CPU Belastung (+) Speicher Administration (+) keine HW Beschränkung (+) Kosten Volume Management online Rekonfiguration Betriebsystem-spezifische Limiten können überwunden werden möglicherweise mit System Management Tools integriert (Reporting von kaputten Disks, SNMP,...) Hot Sparing 90
91 7: HD und Verbindungs-Terminologie Welches ist die Patentlösung Integration von Ebenen: - HW RAID in Arrays - SW Striping zwischen Arrays - LVM für Verwaltung Komplexität? Kosten? 91
92 7: Festplattenplatz & Dateisysteme Boyle's Gesetz: Gas dehnt sich aus, bis es den ganzen Raum erfüllt Ressourcen, bzw. freien Festplattenplatz lassen volles FS -> Verfügbarkeit nicht gegeben besser auf optimale Leistung statt auf Kapazität zu optimieren 40% Reserve lassen 92
93 7: Festplattenplatz & Dateisysteme Weitere Punkte die zu berücksichtigen sind: hot-pluggable Disks physische Kapazität der Einzelteile: - Platz auf Disks - Stecker am RAID Controller - Steckplätze an Backplane - an den Käbeln - im Rack, bzw. im Disk Array, bzw. Disk-Slots - Bodenfläche im Datenzenter - ausreichend Kühlkapazität - genügend Strom-Leistung - Reserveplatz in Kabelleitungen Leistung: - wieviele Platten soll ich an einen Kontroller hängen alle Kosten in Wachstumsplan einrechnen 93
94 7: Festplattenplatz & Dateisysteme Was passiert, wenn ein LUN (z.b. Array) voll ist? vorausplanen! LVM hotplugging Disks Ansonsten: - User vom System nehmen - Backup machen - Maschine runterfahren - erweitern - Backup einspielen - testen - zurück in Produktion Alternativen: - Merge-Mount - FS in mehrere Mountpoints unterteilen 94
95 7: Festplattenplatz & Dateisysteme Disks und Volumes hochverfügbar halten: redundante Datenpfade & Kontroller redundante Disk-Array HW Racks - darauf achten, dass redundante HW nicht im gleicher Rack ist Kabel - verschiedene Pfade von Kabeln - Kabel anmachen Stromversorgung - verschiedene Stromquellen 95
96 7: Festplattenplatz & Dateisysteme Filesystem Wiederherstellung: moderne OS haben Cache -> OS/Maschinen Crash -> FS Korruption möglich FS Check geht lange: ~1min/GB kleine FS besser Journaling FS 96
97 7: Festplattenplatz & Dateisysteme snapshot.debian.net: alle je veröffentlichten Debian Pakete, auch Zwischenversionen Terrabytes an Daten Maschine hatte Absturz FS Check nach einem Monat FS Check 2. Absturz 3 Jahre Archivdaten verloren ( ) 97
98 7: Festplattenplatz & Dateisysteme Die wichtigsten Punkte: Festplatten enthalten Daten, das wichtigste Element der Informatik Daten prioritär schützen Backups machen Spiegeln (RAID-1) ist am besten Spiegeln zwischen Arrays 98
99 8: SAN, NAS & Virtualisierung SANs SAN exportiert virtuelle Disks typischerweise auf eigenem Netzwerk: FC Warum SANs? Zentralisierung & Konsolidierung - Komplexität der Speicherverwaltung wird reduziert - Speicherverwaltung wird flexibler Teilen von Daten - geclusterte Filesysteme - Failover tiefere Netzwerkbelastung effizientere Backups jedoch Kompatibilität zwischen Produkten? Firmware Upgrade SAN Treiber Upgrade Clients? 99
100 8: SAN, NAS & Virtualisierung Hitachi Universal Storag Platform USP1100 ( 100
101 8: SAN, NAS & Virtualisierung NAS NAS exportieren Filesysteme - NFS, CIFS, AppleTalk,... können auf Servern existieren (Samba...) oder auf Appliances - Appliance sehr einfach zu verwalten - performant 101
102 8: SAN, NAS & Virtualisierung SANs oder NAS SAN zentralisiert - Backups - Verwaltung SAN komplexer SAN immer noch in Entwicklung NAS über mehr Protokolle (NFS->TCP->IP->Ethernet): - tiefere Leistung? SAN macht Mirroring etc. einfacher SAN grössere Distanzen 102
103 8: SAN, NAS & Virtualisierung Speicher Virtualisierung virtuelle oder logische Disks Virtualisierung -> flexibler: - Management - Verfügbarkeit (Mirroring, Parität) - keine Grössenlimiten (Aggregation) - Performance (Striping) Virtualisierungs-Ebenen Filesystem: - FS sieht aus, als ob es lokal laufen würde (NFS, CIFS,...) Block: - virtuelle oder logische Disk/Volume können aus verschiedenen physischen Disks zusammengesetzt sein 103
104 8: SAN, NAS & Virtualisierung Block Virtualisierung im Disk Array RAID fortgeschrittene Systeme erlauben Zugriff von diversen Hosts aus - Fallover - Partitionierung Virtualisierungs im Applikations-Server nur Server selbst kann von Virtualisierung profitieren 104
105 8: SAN, NAS & Virtualisierung Virtualisierungs im Speicher-Netz (SAN) In-band Virtualisierung: - alle Anfragen gehen durch eine Box (PC), welche Anfragen an entsprechende Disks weiterleitet - SPOF, Bandbreite Out-of-band Virtualisierung: - die meiste Arbeit geschieht im Treiber des Clients - komplexer, da spezial-sw überall installiert sein muss - ein Fehler im Client und alles ist futsch Virtualisierung und QoS Admin kann verschiedene QoS anbieten: - mehrfache Spiegelung - RAID
106 9: Netzwerke wie fallen Netzwerke aus? wie findet man heraus, ob eine Situation korrigierbar ist? was kann man tun? Netzwerkprobleme schwer mit Sicherheit bestimmbar: - vorübergehende Netzüberlastung - IP ist selbstheilend/routet um Probleme herum 106
107 9: Herausforderungen für Zuverlässigkeit von Netzwerken Bisher: alles unter Kontrolle Netzwerk: verteilt, teils keine SPOFs, unterliegt Kräften von aussen Netzwerkunterbrüche kommen und gehen Überlastung in Wellen -> messen im falschen Moment... Schwierig zu definieren wo Netz ist was wird gemessen? verschiedene Teile von verschiedenen Entitäten kontrolliert Latenz trägt zu wahrgenommenen Ausfällen bei 107
108 9: Herausforderungen für Zuverlässigkeit von Netzwerken DOS sind real Nonsens Anfragen kaputte Geräte Last-Verteilung ist eine Frage von Skalierung und nicht von Zuverlässigkeit Netzwerkzugang ist nicht so sicher wie er sein sollte freie Netzstecker & Fremde mit Laptops falsch konfigurierte Geräte falsche Netzwerkkäbel 108
109 9: Arten von Netzwerkausfällen lokales Netzwerk-Interface Verkabelung: - physikalische Probleme - Ein/Ausstecken - Zug-Kräfte - Abnutzung Netzwerk Infrastruktur - Überlast Router & Routing Information - Konfiguration - Interoperabilität - Redundanz erhöht Last auf Router -> Ausfall zentrale Netzwerk-Dienste: - DNS, DHCP, NIS, LDAP, Sicherheitsdienste... - NFS, DCE/DFS, Windows SMB Latenz Varianz 109
110 9: Erkennung & Behebung Ausfall von physischen Geräten netstat -i -> keine Erhöhung der Paketzählung -> Fehler-zähler -> Input Zähler zentrale Maschine (SA's?) pingen -> Wechsel auf redundantes Netz Ausfälle auf IP Ebene gleiche/falsche IP Adresse -> ARP Race falsche DNS Einträge -> Prozesse verbessern, damit dies nicht passiert 110
111 9: Erkennung & Behebung Ausfälle über Routing Informationen asymetrische Routen unvollständige oder nicht korrekte Routing Einträge -> traceroute Ausfälle durch Überlast kann auch DOS sein Paket-Drop übermässiger Point-to-Point Verkehr (Ethernet ausgelastet) Broadcast Pakete: - UDP: RIP, Cisco HELLO, DHCP, NIS das Server sucht,... - ARP - SMB/CIFS/NetBIOS - UpnP, Rendezvous/Zeroconf - Host hat Broadcast Adresse Multicast Verkehr 111
112 9: Erkennung & Behebung Design- & Betriebs-Richtlinien über Basiswissen verfügen: - wie findet man was heraus, wie funktionieren Protokolle, Dienste, etc. Werkzeuge kennen Router, Filter, Firewalls einsetzen Applikations-Level-Relays einsetzen: - Proxies etc. Bandbreite wird genutzt, wenn sie verfügbar ist! Grundsatz: Redundanz, damit Ausfälle vertragen werden 112
113 9: Erstellen von redundanten Netzen Virtuelle IPs private, administrative Adressen Round-Robin DNS IP Failover nur Dienste müssen mehrere IPs haben Redundante Netzwerk-Verbindungen mehrere Verbindungen an ein Netzwerk machen an mehr als ein Netzwerk anschliessen beides 113
114 9: Erstellen von redundanten Netzen Redundante Netzwerk-Anbindungen redundante Busse? entspricht assymetrischer HA Anbindung an mehrere Netze entspricht symetrischem HA im Prinzip beide Netzwerke nutzbar jedes Interface eigene IP -> Round-Robin DNS Load-Balancing über 2 IP Adressen: - problematisch für einzelnen Client (NFS) Applikation gebunden an IP 114
115 9: Erstellen von redundanten Netzen Interface trunking mehrere Interfaces zusammennehmen Switch muss dies unterstützen (+) Last-Verteilung (+) Schutz vor kaputten Kabeln 115
116 9: Erstellen von redundanten Netzen Konfiguration von mehreren Netzwerken Achtung: Last Problem bei Failover einzelne Netze werden auch Rails (Schienen) genannt asymmetrisch: hot-standby möglicherweise ist's notwendig sicherzustellen, dass alle Hosts gleichzeitig das Netz wechseln Router Konfiguration wird (mit oder ohne verschiedene IP Adressen) komplizierter Failover: Multihoming, DNS Problem, nur virtuelle IP Adresse/ Netz wechselt auf neues Netz bedingt auch Route-Failover von Client 116
117 9: Erstellen von redundanten Netzen IP Routing Redundanz RIP update: 30s TCP sind Routen egal: - jedoch Time-Out (2h) - Switch-Over während Verbindungsphase -> Fehler - temporär asymmetrische Routen Netzwerke mit nur einem Ausgang vermeiden mehr als eine default Route dynamische Umleitung (ICMP redirect) ist gut automatische Failovers mit Scripts: - Ausfall erkennen und Routen ändern redundante Router mit VRRP - Master/Slave Konfiguration von Routern - Failover übernimmt IP, wenn Master ausfällt 117
118 9: Erstellen von redundanten Netzen die Wahl des Failover Mechanismus automatisches Failover -> alle Hosts müssen gleichzeitig ins andere Netz wechseln teilweises Failover -> Chaos wenn Kontrolle an einem Punkt konzentriert ist -> automatisieren sobald viel koordiniert werden muss -> manuell MTTR? 24 * 7 SA
119 9: Load Balancing & Umleitung Round-Robin DNS Hostname/IP TTL klein behalten (+) skaliert gut (+) einfach (-) immer noch Failover Zeit (DNS timeout) (-) mehr DNS Verkehr (-) funktioniert nicht perfekt mit diversen Clients (DNS caching etc.) IP Redirection Zustandsinfo? Teilweise dienen Loadbalancer als TCP Proxies NAT/LB http 119
120 9: Netzwerk Zuverlässigkeit interessante Daten sind üblicherweise: - dynamisch (Aktienkurse etc.) - und/oder persistent (Lohndatenbank,...) normalerweise werden viele low-level Dienste verwendet: - DNS, Directory, RPC, NFS,... - eher Informations- als Transaktionsdienste - oft mit eingebauter Redundanz Netzwerk Dienst Abhängigkeiten login: - auth: /etc/passwd, LDAP, NIS,... - Session Schlüssel von Kerberos holen - NFS mount /home/user - Quota checken - init Script 120
121 9: Netzwerk Zuverlässigkeit Netzwerk Dienst Abhängigkeiten (ff) Abhängigkeits-Graph muss azyklisch sein ansonsten Deadly-Embrace Dienste an der Wurzel sollten repliziert & verfügbar sein sollten gut überwacht werden Ressourcen auf diese konzentrieren SPOF entfernen Überwachungs-Werkzeuge sollten stand-alone sein: - route -n 121
122 9: Netzwerk Zuverlässigkeit Zentrale Dienste härten nie nur einen Server haben (Master/Slave für DNS...) sollten nahe bei Clients stehen in /etc/resolv.conf mehrere Server eintragen Failover-Plan entwerfen: /etc/hosts im Falle einer Katastrophe verwenden Änderungs-Management und Prozesse Netz-Topologie Änderungen können Netzwerk spalten! 122
123 9: Netzwerk Zuverlässigkeit die wichtigen Punkte mehrere Verbindungen zum gleichen Netz oder zu verschiedenen Netzen asymmetrisch oder symmetrisch Kosten und Komplexität abwägen, da alle Systeme davon betroffen sind manueller Failover? fundamentale Netzwerk-Dienste müssen zuverlässig sein 123
124 10: Datenzenter & Lokale Umgebung Datenzenter zentralisierte Ressourcen: (+) Stromversorgung (+) USV (+) Sicherheit (+) erhöhte Böden (+) Klima (-) beschränkter Platz (-) SPOF (-) zu viel physische Sicherheit (-) Umbau->Problem (Staub,...) 124
125 10: Datenzenter & Lokale Umgebung Datenzenter Racks (+) sauber organisiert (+) Sicherheit (+) Strom zentral (+) Kühlung (+) effiziente Raumausnutzung (-) Umbau schwierig (-) Kabelsalat (zusammengebundene Käbel) (-) Rack kann zusammen/umfallen (-) andere SAs leihen sich Teile aus (-) Cola drüberleeren 125
126 10: Datenzenter & Lokale Umgebung Cluster in einem Rack Rack kaput Cluster kaput? Sicherheit & Zugang einfacher Zugang -> kurze MTTR -> jeder kann reinlaufen und... Hosting Outsourcen Sicherheit physisch/datentechnisch (Käbel) übergreifen von Problemen anderer (Feuer, Strom,...) weit entfernt -> MTTR? Infrastruktur OK (Kühlung, Strom,...) Firma macht zu? 126
127 10: Datenzenter & Lokale Umgebung Elektrizität SPOF USV dimensionieren: - geht auch aus: kontrollierter Shutdown Generatoren brauchen (Reserve-)Treibstoff Käbel beschriften Käbel anbinden -> MTTR geht runter -> Systeme können nicht verschoben werden -> Kabelbrüche Käbel entfernen, die nicht gebraucht werden verschiedene Kanäle für doppelte Leitungen 127
128 10: Datenzenter & Lokale Umgebung Kühlung und Umwelteinflüsse Temperaturüberwachung mit Eskalation Systeme sollten sich abschalten Backup Lüfter Wasser, Feuchtigkeit: Detektoren -> Eskalation Feuer... Namenswahl einfach zu behalten systematisch oder aus gleichem Zusammenhang einfach zu buchstabieren 128
129 10: Datenzenter & Lokale Umgebung die wichtigsten Punkte Datenzenter und Racks sind gut, aber kein Allheilmittel Käbel beschriften einfache Namen wählen Kühlung & Sicherheit können genau so wichtig sein wie Spiegelung 129
130 10: Datenzenter & Lokale Umgebung Heisser Sommer 2003 Uni-Fr Server fingen an quer durch Datenzenter auszusteigen ausgelegt für erwartete Temperaturen für Typ von Server-Hardware 130
131 11: Menschen & Prozesse weichere Bereiche: - Prozesse - Menschen Unterhalt (Änderungen!) sollte kleinst möglichen Einfluss auf System haben 131
132 11: Menschen & Prozesse Unterhaltspläne und Prozesse Unterhalt mit Hilfe von Failover durchführen HA macht alles komplizierter: - SCSI Kette darf nicht unterbrochen werden immer: - schlimmsten Fall einplanen - nie Änderung durchführen ohne Plan für Wiederherstellung des alten Zustandes zu haben - evtl. zweites System haben, aus dem man Teile entleihen könnten, im Falle, dass was kaput geht - Peer Review - Folgen auf Umgebung bedenken 132
133 11: Menschen & Prozesse System-Änderungen Unordnung steigt Änderung ist eine Konstante alle Änderungen dokumentieren: - wer, wann, was, warum eine Änderung auf's Mal Verteilung von Dateien automatisieren Änderungs-Management Änderungen des FS im Auge behalten (Tripwire) Alles Testen SW Patches vorsichtig, Schritt nach Schritt nur wenn nötig zuerst rumhören 133
134 11: Menschen & Prozesse Ersatzteil Regelung Teile die am häufigsten ausfallen auf Lager halten: - HDs, Lüfter, Netzteile Teile die am schwersten zu beschaffen sind auf Lager halten Ersatzteile testen, sobald sie ankommen Inventar rotieren Einfacher Zugriff vs Sicherheit Anzahl der Hersteller und Modelle beschränken merherere Zulieferer 134
135 11: Menschen & Prozesse Präventiver Unterhalt HW wird krank bevor sie stirbt: - Logs, Fehlermeldungen VERITAS Lookout für Sun, NT,... Zulieferer gutes Verhältnis mit Zulieferer: haben viel Know How Training und Beratung nutzen! 135
136 11: Menschen & Prozesse wichtige Zulieferer wählen Wettbewerb zwischen Zulieferern fördern: - fair bleiben Rumhören, was Leute sagen - mit Referenzen reden Support austesten: - kommen die Informationen zu einem oder muss man bohren breite Produktepalette mit wem arbeitet Zulieferer zusammen? in Zukunft schauen Cross-Platform Unterstützung bei Zulieferer bleiben Anzahl Zulieferer beschränken 136
137 11: Menschen & Prozesse Zulieferer und Systemwiederherstellung HW: - vor Ort Service - Ersatzteile - Ursachenanalyse SW: - Bug Fixes - Zeit um Probleme zu beheben - Integration Eskalation Management des Kundendienstes kennen Eskalationsprozess kennen 137
138 11: Menschen & Prozesse Verkäufer Integration unterstützen Zulieferer die existierende/geplante Konfiguration? wen zuerst anrufen? 138
139 11: Menschen & Prozesse Sicherheit Leute gut behandeln FW Verschlüsselung starke Passwörter Passörter schützen, nicht an Dritte geben Administrativen Zugang beschränken kein root Login Auditing ermöglichen kritische Passwörter an mehreren Orten (Hirnen) lagern ist der Ort selbst sicher? 139
140 11: Menschen & Prozesse Dokumentation Einarbeiten von neuen Leuten Details, Konzepte SA: Rechtfertigung Doku: - bei Krise - wie, was, wo: Applikationen, Services - Standards, Abhängigkeiten, Anforderungen - wie neue Server, Services, Clients - Monitoring - Netzlayout - Geschichte Sicherheit: Doku ist nicht für jeden 140
141 11: Menschen & Prozesse Funktionen von SA Backup Ingenieur Evaluation von HW/SW HW Ingenieur SW Entwickler Helpdesk muss Benutzer verstehen Sicherheitsexperte Technischer Author Q & A Ingenieur Technischer Trainer Kommunikation mit Benutzer (schlechte Neuigkeiten) Komm. mit Management flexibel 141
142 11: Menschen & Prozesse Funktionen von SA (ff) SAs zufriedenstellen -> Freiheiten Verantwortung geben kein Micromanagement 142
143 11: Menschen & Prozesse Interne Eskalation 24*7 Vertreter entfernter Zugriff Schlüssel und Zugangstokens... Trouble Tickets die wichtigsten Punkte schlechte Doku, Ausbildung, Tests sind mindestens so schlimm wie schlechte Technologie Verhältnis zu Zulieferern SAs sind wichtig Sicherheit 143
144 12: Klienten & Konsumenten Clients sitzen zwischen Datenzenter & Applikation keine Clients -> keine Verfügbarkeit Arbeitsannahme, dass Applikationen nicht selbst HA sind, sich aus der Sicht des Benutzer bestmöglich verhalten sollen 144
145 12: Klienten & Konsumenten Härten von Clients zwei Arten von Clients: - in eigenem Netz (kontrollierte) - öffentliche/internet (nicht kontrollierte) Elimination von Clients als SPOF Wiederherstellung eines Clients 145
146 12: Klienten & Konsumenten Client Backup PCs mit grossen Disks sind zum grössten SPOF für Verlust von Daten geworden Lösungen: - über Netzwerk-Verzeichnis synchronizieren - Netzwerk-Verzeichnis als default-verzeichnis konfigurieren - Box für wichtige Dokumente (sammt Restore) - öffentliche Docking Stationen mit Backup Laufwerken - automatische Backups bei Wiederanschluss - intelligent, kopieren nicht alles 146
147 12: Klienten & Konsumenten Client Herstellung im Falle, dass ein Client ausfällt sollte Ersatz da sein Ausfälle: - HW - Virus - Benutzer konfiguriert seinen Client um -... automatische Herstellung von Clients: - wichtige Apps - System - wichtige Configs, Bookmarks etc. Thin Clients können sehr effizient sein Server muss redundant sein Applikationen müssen Failover überstehen 147
148 12: Klienten & Konsumenten Tolerieren von Daten-Service Ausfällen für einen Client sieht ein Failover wie ein Reboot aus meiste DB Applikationen verbinden neu, Rollforward File Server Client Wiederherstellung: NFS Soft Mounts per default: hard -> nochmals versuchen Daten-Integrität sollte Vorrang haben soft mount gibt Null-Daten zurück wenn App nicht sorgfältig programmiert! kann korrumpierte Daten zur Folge haben 148
149 12: Klienten & Konsumenten Automounter Tricks automounter kann über mehrere Server Lastausgleich machen (nur Sun?) wenn Server abstürzt, während ein Client ein FS gemounted hat -> blockiert Windows File Sharing ähnelt NFS Soft mounts 149
150 12: Klienten & Konsumenten Datenbank Applikations-Wiederherstellung Transaktionen einfacher als NFS Wiederverbinden (Transaktionen überprüfen, Authentifizierung) Fehler überprüfen! Timeouts/Dead-Man Timer Suchpfade (IPs) für Client 150
151 12: Klienten & Konsumenten Web Client Wiederherstellung stop, reload Formulare -> Browser fragt, ob er Seite nochmal senden sollte -> Zustand in DB SSL reconnect oder Frontend SSL Loadbalancing Server 151
152 12: Klienten & Konsumenten die wichtigsten Punkte sicherstellen, dass es Client Maschinen hat, wenn gebraucht PCs können schnell, lokale, wichtige Daten verlieren -> Backup Client Systems sollten von Server Failover womöglich nicht betroffen sein 152
153 13: Applikations-Wiederherstellung was macht die Applikation, wenn ein darunterliegender Dienst versagt? welche sonstigen Sachen können innerhalb einer Applikation schief gehen? Übersicht Applikations-Wiederherstellung Applikationen können durch Failover verwirrt werden für einen Client sieht ein Failover wie ein Reboot aus: - neu verbinden - Operationen, welche in der Ausführung waren wiederholen - weitermachen 153
154 13: Applikations-Wiederherstellung Arten von Applikations-Ausfällen Server-Neustart wird nicht korrekt verarbeitet nicht-fatale oder externe Fehler - kann Server nicht finden - nicht genügend Speicher - Schreibvorgang misslingt - kann auch bei Failover passieren! Interne Speicher & Zustandsverwaltung - C bugs -> andere Sprachen verwenden -> Java etc. 154
155 13: Applikations-Wiederherstellung Arten von Applikations-Ausfällen logische Fehler - Loops - App hängt sich auf - Deadlock - unerwarteter Input - unerwartete Antworten Leute aus allen Sparten zusammenbringen und auf Ziel % Verfügbarkeit ausrichten 155
156 13: Applikations-Wiederherstellung Techniken für Applikations-Wiederherstellung frühzeitige Erkennung beugt Schaden vor wie reagieren? Kosten-Zeit-Gewinn abwägen Erkennen & Wiederversuchen -> Promt Abort, Retry, Fail sanftes Herunterfahren: - Daten in konsistentem Zustand hinterlassen - den Benutzer darüber informieren: - was passiert ist - wie weiter crash, burn, restart von checkpoint starten an nächste Instanz eskalieren -> menschliche Interaktion 156
157 13: Applikations-Wiederherstellung sanftere Ausfälle Problem automatisch an Helpdesk melden versuchen alles konsistent zu verlassen und aufzuräumen nützliche Fehlermeldung ausgeben 157
158 13: Applikations-Wiederherstellung Applikations-Wiederherstellung nach FS Ausfall z.b. volle Disk, etc. Kein Virtueller Speicher mehr mallocs überprüfen aber auch: - keine neuen Prozesse erstellen möglich - keine neuen Sockets/Files können geöffnet werden - Systemaufrufe schlagen fehl (EAGAIN) problematischen Prozess killen neustarten (Forkbomben) 158
159 13: Applikations-Wiederherstellung E/A Fehler normalerweise von RAID abgefangen asynchrones Schreiben -> sync durchführen evtl. sanft runterfahren kein Checkpoint? 159
160 13: Applikations-Wiederherstellung Wiederverbinden mit der DB eine gute Applikation wird neu verbinden Transaktion wiederholen - evtl. Überprüfen, ob Transaktion angekommen ist -> Benutzer Interaktion! Probleme: - Client crasht, wenn keine Verbindung mehr da ist - Benutzer muss neu einloggen - komisches Schweigen der Applikation -> Feedback! 160
161 13: Applikations-Wiederherstellung Netzwerk Probleme Netzwerkprobleme sollten kurzlebig sein: -> warten und nochmals probieren Netzwerk Dienste neustarten SO_REUSEADDR: - späterer Prozess kann Socket wiederverwenden, wenn App gecrasht ist TCP Timeouts tunen: - close wait per default 2h - keepalive 161
162 13: Applikations-Wiederherstellung Interne Applikationsfehler Array Index Overflow Null Pointer nicht initializierte Pointer Buffer Overflow Speicherlecks Speicherzugriffsfehler -> Logischer Fehler -> Speicherleck -> Korrupte Daten 162
163 13: Applikations-Wiederherstellung Speicher Korruption und Wiederherstellung SIGSEGV verarbeiten: - Zustand rausschreiben - bei Checkpoint neustarten interne Checks: -> extreme Programming, Peer Review -> Java, Constraints etc. Hängende Prozesse Loop Deadlock Heartbeat auf Applikationsebene mit Failover verschiedene Locking Mechanismen nicht mischen 163
164 13: Applikations-Wiederherstellung Entwickler Hygiene Rückgabewerte überprüfen: - Schreibzugriffe sind gebuffert -> Fehler kommt erst nach nächstem Schreibzugriff - close gibt letzten Fehler zurück Grenzbedingungen prüfen: - Eingaben prüfen - Test-Werkzeuge verwenden - Test-Fälle logische Wert-Prüfung - Busines Logic 164
165 13: Applikations-Wiederherstellung Entwickler Hygiene (ff) Logging Unterstützung - Logs klar verständlich machen (durch Menschen lesbar) - Zeitstempel - nicht zu viele Logs 165
166 13: Applikations-Wiederherstellung: Prozesse Redundante Dienst-Prozesse Multi-Prozess bzw. -Thread Server -> mehr Redundanz so wenig Zustand wie möglich ansonsten Zustand in DB Multicast von Prozess Status nützlich, wenn Applikation Transaktions-Zustand im Hauptspeicher behalten muss Übermittlungs-Semantik: - mindestens einmal: Applikation muss mit Duplikaten zurechtkommen - höchstens einmal - genau einmal wie sieht's mit Latenz aus bei Last? 166
167 13: Applikations-Wiederherstellung: Prozesse Checkpoints nützlich, wenn Prozesse lange laufen (Simulationen,...), damit diese neu starten können auf Applikations-Ebene core-dumps -> sollten auch Informationen über Position in Datei, Locks etc. enthalten Aufwand/Frequenz von Checkpoint abwägen Nichts annehmen, alles behandeln vorsicht vor schnellen Hacks 167
168 13: Applikations-Wiederherstellung die wichtigsten Punkte Applikation müssen Ausfälle von Daten-Diensten überstehen. Warten, wieder versuchen externe Bedingungen müssen verstanden, und man muss mit diesen auskommen können Prozessreplikation & Checkpointing hilf bei lange laufenden Apps sorgfältige Entwicklung 168
169 14: Daten-Dienst Zuverlässigkeit was passiert mit DB, HTTP, NFS, wenn der Server abstürzt? Network File Services für Client sehen Server- oder Netzunterbruch gleich aus: -> schickt Anfrage noch Mal RPC - rpc.mountd - FS einbinden - nfsd - Daten liefern, oft innerhalb des OS - rpc.lockd - Locking Dienst - rpcbind/portmap - Dienst auf Portnummer Abbildung 169
170 14: Daten-Dienst Zuverlässigkeit: NFS NFS Tests nullproc rpcinfo -p host - macht nichts (entspricht NOP) - zeigt registrierte Services an ping an Service bekannte Datei lesen/schreiben - achtung Cache - Locking schaltet Cache aus! - aufpassen, dass Testprozedur FMS nicht blockiert 170
171 14: Daten-Dienst Zuverlässigkeit: NFS NFS Server Einschränkungen Client wird an Fallover wieder-anbinden, falls gleiche IP/hostname/FS-Nummer NFS Failover IP/Hostnamen/Disks übernehmen Clients während Failover: - hängen (im Kernel -> kann nicht gekillt werden) - wiederholen Anfragen 5 Mal mit steigender Pause nachdem Failover da ist: alles i.o. (bedingt hard-mount!) 171
172 14: Daten-Dienst Zuverlässigkeit: NFS NFS Wiederherstellung optimieren auf Server ausschliesslich NFS laufen lassen kein Cross-mount journaled FS (fsck bei Failover) 172
173 14: Daten-Dienst Zuverlässigkeit: NFS Datei-Locking NFS & Locking vertragen sich nicht allzu gut: stateful vs stateless stateless besser, da kein Zustand wiederhergestellt werden muss NFS unterstützt nur Gentleman's Locking ( advisory ) ansonsten Client Crasht -> kein Zugang NLM: network lock manager: - Client und Server monitoren sich gegenseitig rpc.statd: - befreit Locks bei Crash einer der beiden Seiten - Client Crash -> Server löst Lock auf - Server Crash -> nach Reboot hat Client Zeitfenster um Lock neu zu setzen 173
174 14: Daten-Dienst Zuverlässigkeit: NFS Datei-Locking (ff) sicherstellen, dass Status-Information von lockd/statd auch auf geteilten Disks liegt! -> jedoch trotzdem Probleme: Benutzer entfernt gelockte Datei... nicht alle Applikationen sind Gentlemen nicht mehr gültige Datei-Handles NFS Datei Handle: - Server IP, FS ID, Inode, Inode Generationsnummer Datei entfernen, neue erstellen -> gleiche Inode Nummer! -> Applikation denkt immer noch, dass es sich um gleiche Datei 174
175 14: Daten-Dienst Zuverlässigkeit: DB DB Server ACID: - Atomic (entweder ganz oder gar nicht) - Consistent - Independent (Transaktionen beeinflussen sich nicht) - Durable (auch nach Absturz OK) Wiederherstellungszeit im Griff haben was passiert bei Failover? 175
176 14: Daten-Dienst Zuverlässigkeit: DB Datenbank Überwachung sicherstellen, dass es sich um Ausfall und nicht Verzögerung handelt (aufwändige OP im Gang) SQL Anfragen Caching... Datenbank Neustarts 1. Disks rübernehmen 2. evtl. FS checken (raw/cooked) 3. DB neustarten bei Log-basierten FS wird 2 Mal gecheckt (FS, DB Log) was passiert, wenn Diskplatz aufgebraucht wird (z.b. durch core-dump der Applikation) 176
177 14: Daten-Dienst Zuverlässigkeit: DB Sicherheit und Geschwindigkeit Log-Grösse vs Geschwindigkeit vs DB-replay Grösse von Transaktionen und Checkpoints grosse vs kleine Transaktionen: - klein -> Zustand in Client -> Client crasht? Checkpoints -> Logs in DB schreiben 177
178 14: Daten-Dienst Zuverlässigkeit: DB Parallele Datenbanken mehrere DB Engines auf geteilten Disks oder auf shared nothing verteilter Lock Manager: - koordiniert Inserts etc. DB muss Logreplay machen auf gecrashter DB -> log ist weg // DBs schreiben langsamer 178
179 14: Daten-Dienst Zuverlässigkeit Redundanz und Verfügbarkeit Mehrere unabhängige Server-Instanzen ohne gemeinsame Zustandsinformation: - Haufen von Maschinen Mehrere Instanzen mit wenig gemeinsamem Zustand - Kopieren von Zustand von Speicher zu Speicher Disk-basierter gemeinsamer Zustand - klassische Cluster Tief oder Breit? hohe Leistung & HA: - auf grosser Maschine oder auf vielen kleinen Boxen 179
180 14: Daten-Dienst Zuverlässigkeit: Web Grosse Code-Pfad-Verhältnis Regel Userspace vs Kernelspace 1. ist Zustandsinformation involviert? -> speichern auf einer Instanz -> grosse Maschine: Zustand ist schwer zu verteilen 2. sind Clients Server-agnostisch? -> breit 3. Code Pfad-Verhältnis nahe bei 0? - d.h. Ausführungspfad ist fast nur im OS (Kernel) -> OS ist Flaschenhals -> mehr Maschinen (breit) 180
181 14: Daten-Dienst Zuverlässigkeit: Web Web Server: Bedingungen für HA sollte einziger Service auf Maschine sein CGIs, welche mit DBs reden sind Clients CGI muss im Stande sein neuzustarten nach einem Ausfall Web Server Farmen NFS Fileserver Backend Load balancing oder TCP Reverse-Proxies die auf gesunden Webserver umschalten Failover Zeit shared nothing Zustand kann z.b. in URL gespeichert werden 181
182 14: Daten-Dienst Zuverlässigkeit: Web Applikations-Server Zustand kann gespeichert werden in: - URL - Cookie - Backend-DB - kann zwischen Servern ausgetauscht werden Weitere Stufen Verzeichnis Server DB Backends Web Services 182
183 14: Daten-Dienst Zuverlässigkeit: Web die wichtigsten Punkte darauf achten wie sich Applikationen während der Wiederherstellung verhalten: - einige Daten-Dienste (DB) beeinträchtigen die Applikation bei Failover - einige brauchen konsistente Konfigurations-Infotmationen (NFS) Zuverläsigkeit heisst nicht immer Cluster: - je nach zu erhaltenden Zustandsinformationen -> andere Architekturen 183
184 15: Lokales Clustering und Failover zweiter Server als Backup/Fallback 184
185 15: Über Server Fehler & Failover manchmal geht es sehr lange bis Fehler diagnostiziert wird (Stunden, Tage...) HW ersetzen, Datenkonsistenz wiederherstellen, neustarten dazwischen Failover: Migration von Diensten von einer Maschine auf eine andere 185
186 15: Über Server Fehler & Failover Failover (Migration von Diensten von einer Maschine auf eine andere) muss folgende Kriterien erfüllen: Transparent - Failover sollte für Client nicht schwerwiegender als Server Reboot sein - erneutes Login möglich aber nur bei Diensten, die's verlangen (z.b. DBs, aber nicht unbedingt Fileserver) Schnell - ideal nicht länger als 5 min, besser 2 min - idealerweise Übernahme-Server schon gebootet - cold boot Failover lohnenswert? -> u.u. muss FS gecheckt werden
187 15: Über Server Fehler & Failover Kriterien für Failover (ff): Garantierter Datenzugriff - Failover sollte gleiche Daten sehen wie Original - Datenreplikation fügt eine Komplexitätsstufe hinzu Systeme in einer Failover Konfiguration sollten miteinander dauernd in Kontakt stehen, damit jedes den Zustand des anderen kennt -> Heartbeat 187
188 15: Über Server Fehler & Failover Bei einem Failover müssen drei kritische Elemente vom nicht mehr funktionierenden Server zum Takeover Server hinüberwechseln: 1. Netzwerk Identität: - IPs - evtl. MAC Adressen 2. Zugriff auf geteilte Festplatten - OSe & FSe erlauben nicht, dass mehrere Server gleichzeitig auf geteilte Festplatten zuzugreifen - logischer Zugriff muss auf einen Server beschränkt bleiben - bei Failover muss die Rolle der Server vertauscht werden 188
189 15: Über Server Fehler & Failover 3. Dienst-Prozesse - sobald Disks zum Failover Server gewechselt haben müssen alle Prozesse, die auf die Daten zugreifen neugestartet werden. Datenkonsistenz aus der Perspektive der Applikation muss sichergestellt werden. Diese 3 Elemente zusammen werden als Service Group bezeichnet. Wenn auf einem Server mehrere Service Groups existieren müssen diese vollständig unabhängig voneinander sein, damit sie auf einer beliebigen Maschine im Cluster weiterexistieren können. 189
190 15: Logische, Applikations-zentrierte Denkweise andere Herangehensweise an IT die tiefste Ebene der IT Stacks ist nicht mehr der Server, sondern die Applikation Applikationen sind mit Netzwerkidentitäten, persistentem Speicher und Rechenressourcen assoziiert Cluster dienen als Black Boxes, die einen bestimmten Dienst zur Verfügung stellen 190
191 15: Bedingungen an Failover-Lösungen Server soweit als möglich identische Konfiguration Netzwerke ein (besser: ein Paar unabhängige) Heartbeat Netzwerk(e) ein Dienst-Netzwerk ( public Network ) ein Administrations-Netzwerk 191
192 15: Bedingungen an Failover-Lösungen Festplatten interne Disks -> OS etc. geteilte Disks mit Applikationsdaten - migrieren zwischen Haupt- und Fallback Server hin und her - erreichbar von beiden Servern aus, Zugriff jedoch nur von einem Server aus - werden auch public Disks genannt manchmal shared nothing -> Replikation -> komplexer - OK für WAN Failover - NOK für lokales Failover Applikationsportabilität 192
193 15: Bedingungen an Server sollten gleich oder ähnliche sein (HW, SW,...) + bringt viele Vorteile mit sich + achtung: kleine Unterschiede (andere CPU, RAM...) Failover zwischen inkompatiblen Servern Failover Management System (FMS) muss kompatibel sein Applikation und Datenformate müssen kompatibel sein Netzanbindung kompatibel Disks kompatibel (low-level bis FS) Administration sehr erschwert: identische Konfiguration auf beiden Servern Support erschwert (der andere ist schuld) 193
194 15: Bedingungen an Netzwerke Heartbeat ping, jedoch auch komplexer über beliebiges Medium serielle Verbindung aufgrund von hohen Latenzen nicht empfohlen (?) 194
195 15: Bedingungen an Netzwerke wenn Heartbeat unterbricht: Primärer Server ist unten Heartbeat NIC ist kaput -> Fallback NIC/Netz - Achtung: NIC mit zwei Ausgängen... Heartbeat Kabel kaput Hearbeat Netzüberlast -> anzahl Server auf Hearbeat Netz beschränken Hub kaputt Heartbeat Prozess kaputt -> Heartbeat überwachen und neustarten anderer Server überlastet/zu langsam - Δt gross genug wählen 195
196 15: Bedingungen an Netzwerke low-level Problem - Dienst ohne Netz == kein Dienst - es droht Datenkorruption! - FMS sollte im Stande sein anderen Server vom Netz zu nehmen (Stom abschalten) letztinstantlicher Schutz gegen falsche Positive ist der Mensch! Disk-basierte Hearbeats möglich - Kommunikation über Medium auf dem Daten sind was passiert, wenn Hearbeat unterbricht? annehmen das Gegenüber unten ist oder menschliche Intervention verlangen Problem: Split Brain - beide Server denken sie wären der Primäre Server -> Datenkorruption - Server der keinerlei Netzverbindung mehr hat sollte sich abschalten, da er keinen Dienst mehr erbringen kann 196
197 15: Bedingungen an Netzwerke Netzwerk Identität transferieren sobald Failover passiert müssen öffentliche IP und logischer Host Namen zum Takeover Server migrieren Problem: MAC-IP (ARP) Cache auf Clients Lösungsansätze: gratuitous ARP (unaufgefordertes ARP) - Server sendet unaufgefordert ein ARP Antwort Paket in dem seine IP der neuen MAC Adresse zugeordnet wird -> alle Clients die dieses Paket sehen sollten Ihre MAC-IP Tabelle anpassen MAC Adresse transferieren: - achtung: Switches: MAC-Port Mapping kann Spanning Tree Algorithmus auslösen -> Netzwerksplit
198 15: Bedingungen an Netzwerke Netzwerk Identität transferieren (ff) warten - ARP Cache Zeit tief stellen, damit Clients ASAP ein ARP für die neue MAC Adresse machen - häufiges Default 2Min! - ARP Cache 30s -> MTTR ~= 30s 198
199 15: Bedingungen an Netzwerke IP Adressen und Namen ideal wenn man IP Adressen und Namen nach Funktion auftrennt private Namen/IDs (evtl. intern in /etc/hosts) -> eigene Identität öffentliche ( public ) Namen -> assoziiert mit Dienst administrative Namen -> für Netz-/Sysadmin - kann mit privatem Namen identisch sein - jede NIC eigene Adresse 199
200 15: Bedingungen an Netzwerke Administratives Netzwerk Maschine sollte erreichbar sein -> eigene Adresse/Namen! Adresse/Namen des Servers im adm. Netzwerk sollte nicht öffentlich sein muss nicht HA sein 200
201 15: Bedingungen an Festplatten zwei Arten von Platten: private Platten,welche zu einem Server gehören geteilte Platten, welche zu einem Dienst gehören Private Platten: sollten intern gespiegelt sein können extern sein, damit MTTR kleiner ist auf beiden Servern in gleichem Zustand -> automatisierte Replikation 201
202 15: Bedingungen an Festplatten Geteilte Platten: beide Systeme brauchen physischen Zugang, doch nur eines darf die Platte nutzen RAID5 oder RAID-*1* Multipath gut Vorsicht: Caching von Daten im RAM - Schreibzugriffe - Cache ohne Batterie inakzeptabel - Cache auf Kontroller (im Gegesatz zu Arrays) ist für Failover nicht akzeptabel! 202
203 15: Bedingungen an Festplatten Geteilte Platten (ff): Dual Hosting Zugriff ist durch externe Software auf Servern geregelt spezielle HW nötig, welche dies unterstützt - nicht alle Lösungen mit allen Plattformen kompatibel Shared Nothing Datenreplikation komplizierter braucht funktionierendes Netz und funktionierenden Takeover Host jeder Schreibzugriff muss erfolgreich sein! 203
204 15: Bedingungen an Festplatten Wo kommen kritische Applikationen hin? auf geteilter Disk: + Änderung nur an einem Platz nötig - kein Rollback nach Upgrade möglich 204
205 15: Bedingungen an Festplatten Die wichtigsten Punkte alles geht Mal kaputt wichtigste Komponenten müssen zweifach vorhanden sein um Applikations-Verfügbarkeit zu maximieren muss ein zweites System für Fallback vorhanden sein sicherstellen/testen, dass es auch wirklich funktioniert IP- und Namensverteilung planen 205
206 16: Failover Management? 206
Verfügbarkeit von Applikationen und Failover Szenarien. Winfried Wojtenek. wojtenek@mac.com
Verfügbarkeit von Applikationen und Failover Szenarien Winfried Wojtenek wojtenek@mac.com Verfügbarkeit % Tage Stunden Minuten 99.000 3 16 36 99.500 1 20 48 99.900 0 9 46 99.990 0 0 53 99.999 0 0 5 Tabelle
MehrSpotlight 5 Gründe für die Sicherung auf NAS-Geräten
Spotlight 5 Gründe für die Sicherung auf NAS-Geräten NovaStor Inhaltsverzeichnis Skalierbar. Von klein bis komplex.... 3 Kein jonglieren mehr mit Wechselmedien... 3 Zentralisiertes Backup... 4 Datensicherheit,
MehrInstallation SQL- Server 2012 Single Node
Installation SQL- Server 2012 Single Node Dies ist eine Installationsanleitung für den neuen SQL Server 2012. Es beschreibt eine Single Node Installation auf einem virtuellen Windows Server 2008 R2 mit
MehrAlbert HAYR Linux, IT and Open Source Expert and Solution Architect. Open Source professionell einsetzen
Open Source professionell einsetzen 1 Mein Background Ich bin überzeugt von Open Source. Ich verwende fast nur Open Source privat und beruflich. Ich arbeite seit mehr als 10 Jahren mit Linux und Open Source.
MehrProSeminar Speicher- und Dateisysteme
ProSeminar Speicher- und Dateisysteme Netzwerkspeichersysteme Mirko Köster 1 / 34 Inhalt 1. Einleitung / Motivation 2. Einsatzgebiete 3. Fileserver 4. NAS 5. SAN 6. Cloud 7. Vergleich / Fazit 8. Quellen
MehrGuide DynDNS und Portforwarding
Guide DynDNS und Portforwarding Allgemein Um Geräte im lokalen Netzwerk von überall aus über das Internet erreichen zu können, kommt man um die Themen Dynamik DNS (kurz DynDNS) und Portweiterleitung(auch
MehrBetriebssysteme K_Kap11C: Diskquota, Raid
Betriebssysteme K_Kap11C: Diskquota, Raid 1 Diskquota Mehrbenutzer-BS brauchen einen Mechanismus zur Einhaltung der Plattenkontingente (disk quotas) Quota-Tabelle enthält Kontingenteinträge aller Benutzer
Mehr3 Windows als Storage-Zentrale
3 Windows als Storage-Zentrale Windows als zentrale Datenspeichereinheit punktet gegenüber anderen Lösungen vor allem bei der Integration in vorhandene Unternehmensnetze sowie bei der Administration. Dabei
MehrDatensicherung EBV für Mehrplatz Installationen
Datensicherung EBV für Mehrplatz Installationen Bitte beachten Sie EBV 3.4 bietet Ihnen die Möglichkeit eine regelmäßige Sicherung der Daten vorzunehmen. Wir möchten Sie darauf hinweisen, dass Sie für
MehrWo finde ich die Software? - Jedem ProLiant Server liegt eine Management CD bei. - Über die Internetseite http://www.hp.
Erfahrungen mit dem Insight Manager von HP Dipl. Ing. Elektrotechnik (FH) - Automatisierungs- / Regelungstechnik DV-Spezialist Landesbank Rheinland-Pfalz Abteilung 2-351 Große Bleiche 54-56 55098 Mainz
MehrDie allerwichtigsten Raid Systeme
Die allerwichtigsten Raid Systeme Michael Dienert 4. Mai 2009 Vorbemerkung Dieser Artikel gibt eine knappe Übersicht über die wichtigsten RAID Systeme. Inhaltsverzeichnis 1 Die Abkürzung RAID 2 1.1 Fehlerraten
MehrRoot-Server für anspruchsvolle Lösungen
Root-Server für anspruchsvolle Lösungen I Produktbeschreibung serverloft Internes Netzwerk / VPN Internes Netzwerk Mit dem Produkt Internes Netzwerk bietet serverloft seinen Kunden eine Möglichkeit, beliebig
MehrStorage as a Service im DataCenter
Storage as a Service im DataCenter Agenda Definition Storage as a Service Storage as a Service und IT-Sicherheit Anwendungsmöglichkeiten und Architektur einer Storage as a Service Lösung Datensicherung
MehrFolgende Einstellungen sind notwendig, damit die Kommunikation zwischen Server und Client funktioniert:
Firewall für Lexware professional konfigurieren Inhaltsverzeichnis: 1. Allgemein... 1 2. Einstellungen... 1 3. Windows XP SP2 und Windows 2003 Server SP1 Firewall...1 4. Bitdefender 9... 5 5. Norton Personal
MehrFachbericht zum Thema: Anforderungen an ein Datenbanksystem
Fachbericht zum Thema: Anforderungen an ein Datenbanksystem von André Franken 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis 1 2 Einführung 2 2.1 Gründe für den Einsatz von DB-Systemen 2 2.2 Definition: Datenbank
MehrOP-LOG www.op-log.de
Verwendung von Microsoft SQL Server, Seite 1/18 OP-LOG www.op-log.de Anleitung: Verwendung von Microsoft SQL Server 2005 Stand Mai 2010 1 Ich-lese-keine-Anleitungen 'Verwendung von Microsoft SQL Server
MehrNAS 251 Einführung in RAID
NAS 251 Einführung in RAID Ein Speicher-Volume mit RAID einrichten A S U S T O R - K o l l e g Kursziele Nach Abschluss dieses Kurses sollten Sie: 1. Ü ber ein grundlegendes Verständnis von RAID und seinen
Mehr1 Modular System Dual SCM MPIO Software Installation
1 Modular System Dual SCM MPIO Software Installation Dieses Dokument soll dabei helfen ein MAXDATA SAS Disk Array mit Dual Controllern redundant an zwei Storage Controller Module (SCM) im MAXDATA Modular
MehrNutzung der VDI Umgebung
Nutzung der VDI Umgebung Inhalt 1 Inhalt des Dokuments... 2 2 Verbinden mit der VDI Umgebung... 2 3 Windows 7... 2 3.1 Info für erfahrene Benutzer... 2 3.2 Erklärungen... 2 3.2.1 Browser... 2 3.2.2 Vertrauenswürdige
MehrDatensicherheit und Hochverfügbarkeit
Datensicherheit und Hochverfügbarkeit 1. Instanzfehler Aussage: Instanzfehler werden durch Crash Recovery vom DBS automatisch behandelt. Recovery Zeiten? Ausfall von Speichersubsystem, Rechner,...? Ausfall
MehrI N F O R M A T I O N V I R T U A L I S I E R U N G. Wir schützen Ihre Unternehmenswerte
I N F O R M A T I O N V I R T U A L I S I E R U N G Wir schützen Ihre Unternehmenswerte Wir schützen Ihre Unternehmenswerte Ausfallsicherheit durch Virtualisierung Die heutigen Anforderungen an IT-Infrastrukturen
MehrStorage Virtualisierung
Storage Virtualisierung Einfach & Effektiv 1 Agenda Überblick Virtualisierung Storage Virtualisierung Nutzen für den Anwender D-Link IP SAN Lösungen für virtuelle Server Umgebungen Fragen 2 Virtualisierung
Mehrmit ssh auf Router connecten
Dateifreigabe über Router Will man seine Dateien Freigeben auch wenn man hinter einem Router sitzt muss man etwas tricksen, das ganze wurde unter Windows 7 Ultimate und der Router Firmware dd-wrt getestet.
MehrDatensicherung. Beschreibung der Datensicherung
Datensicherung Mit dem Datensicherungsprogramm können Sie Ihre persönlichen Daten problemlos Sichern. Es ist möglich eine komplette Datensicherung durchzuführen, aber auch nur die neuen und geänderten
MehrLexware professional und premium setzen bis einschließlich Version 2012 den Sybase SQL-Datenbankserver
Eine Firewall für Lexware professional oder premium konfigurieren Inhaltsverzeichnis: 1. Allgemein... 1 2. Einstellungen... 1 3. Die Firewall von Windows 7 und Windows 2008 Server... 2 4. Die Firewall
MehrINTERNETZUGANG WLAN-ROUTER ANLEITUNG FIRMWARE-UPDATE SIEMENS
Wichtige Hinweise: Das Firmware-Update geschieht auf eigene Gefahr! NetCologne übernimmt keine Verantwortung für mögliche Schäden an Ihrem WLAN-Router, die in Zusammenhang mit dem Firmware-Update oder
MehrInhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER
AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER Inhalt 1 Einleitung... 1 2 Einrichtung der Aufgabe für die automatische Sicherung... 2 2.1 Die Aufgabenplanung... 2 2.2 Der erste Testlauf... 9 3 Problembehebung...
MehrICS-Addin. Benutzerhandbuch. Version: 1.0
ICS-Addin Benutzerhandbuch Version: 1.0 SecureGUARD GmbH, 2011 Inhalt: 1. Was ist ICS?... 3 2. ICS-Addin im Dashboard... 3 3. ICS einrichten... 4 4. ICS deaktivieren... 5 5. Adapter-Details am Server speichern...
MehrKonfiguration Firewall (Zyxel Zywall 10) (von Gruppe Schraubenmeier)
Konfiguration Firewall (Zyxel Zywall 10) (von Gruppe Schraubenmeier) Firewall über Seriellen Anschluss mit Computer verbinden und Netzteil anschliessen. Programm Hyper Terminal (Windows unter Start Programme
MehrSichere Daten mit OSL Storage Cluster
Sichere Daten mit OSL Storage Cluster Alternative Konzepte für die Datensicherung und Katastrophenvorsorge Dipl.-Ing. Torsten Pfundt Gliederung Voraussetzungen für die Konzepte und Lösungen restorefreies
MehrRAID Software. 1. Beginn
1. Beginn RAID Software Die RAID Software ist ein auf Windows basierendes Programm mit einer grafischen Benutzerschnittstelle und bietet Ihnen ein leicht zu bedienendes Werkzeug zum Konfigurieren und Verwalten
Mehrbackupmyfilestousb ==> Datensicherung auf USB Festplatte
Diese Präsentation zeigt Ihnen den Vergleich von mit anderen Datensicherungsverfahren. Backupmyfilestousb ist eine Software für Datensicherung, mit der Sie Ihre Daten täglich oder mehrmals täglich auf
MehrANYWHERE Zugriff von externen Arbeitsplätzen
ANYWHERE Zugriff von externen Arbeitsplätzen Inhaltsverzeichnis 1 Leistungsbeschreibung... 3 2 Integration Agenda ANYWHERE... 4 3 Highlights... 5 3.1 Sofort einsatzbereit ohne Installationsaufwand... 5
MehrAnleitung # 4 Wie mache ich ein Update der QBoxHD Deutsche Version
Anleitung # 4 Wie mache ich ein Update der QBoxHD Deutsche Version Stand: 25. Juni 2009 Voraussetzung Das Update ist notwendig, um Fehler und Neuentwicklungen für die QBoxHD zu implementieren. Es gibt
MehrNetzwerk-Fileservices am RUS
Netzwerk-Fileservices am RUS Markus Bader 15.09.2010 RUS AK Storage, Markus Bader, 15.09.2010 Seite 1 Fileservices am RUS Fileserver für Windows innerhalb des RUS-Active Directory Fileserver für Windows
Mehr"Backup and Restore" unter Linux
"Backup and Restore" unter Linux A. Gredler 2.3.2008 / Linuxtage Chemnitz A. Gredler Backup and Restore CLT08 1 / 34 Gliederung 1 Einleitung 2 Klassische Probleme
MehrSolaris Cluster. Dipl. Inform. Torsten Kasch <tk@cebitec.uni Bielefeld.DE> 8. Januar 2008
Dipl. Inform. Torsten Kasch 8. Januar 2008 Agenda Übersicht Cluster Hardware Cluster Software Konzepte: Data Services, Resources, Quorum Solaris Cluster am CeBiTec: HA Datenbank
MehrInstallationsanleitung SSL Zertifikat
Installationsanleitung SSL Zertifikat HRM Systems AG, Technikumstrasse 82, Postfach, CH-8401 Winterthur, Telefon +41 52 269 17 47, www.hrm-systems.ch Inhaltsverzeichnis 1. Einleitung 3 2. Austausch Zertifikat
MehrUpdatehinweise für die Version forma 5.5.5
Updatehinweise für die Version forma 5.5.5 Seit der Version forma 5.5.0 aus 2012 gibt es nur noch eine Office-Version und keine StandAlone-Version mehr. Wenn Sie noch mit der alten Version forma 5.0.x
MehrMemeo Instant Backup Kurzleitfaden. Schritt 1: Richten Sie Ihr kostenloses Memeo-Konto ein
Einleitung Memeo Instant Backup ist eine einfache Backup-Lösung für eine komplexe digitale Welt. Durch automatisch und fortlaufende Sicherung Ihrer wertvollen Dateien auf Ihrem Laufwerk C:, schützt Memeo
MehrWORKSHOP VEEAM ENDPOINT BACKUP FREE
WORKSHOP VEEAM ENDPOINT BACKUP FREE Haftungsausschluss Ich kann für die Richtigkeit der Inhalte keine Garantie übernehmen. Auch für Fehler oder Schäden die aus den Übungen entstehen, übernehme ich keine
MehrPowermanager Server- Client- Installation
Client A Server Client B Die Server- Client- Funktion ermöglicht es ein zentrales Powermanager Projekt von verschiedenen Client Rechnern aus zu bedienen. 1.0 Benötigte Voraussetzungen 1.1 Sowohl am Server
MehrWir bringen Ihre USB Geräte ins Netz Ohne Wenn und Aber!
Wir bringen Ihre USB Geräte ins Netz Ohne Wenn und Aber! USB Device Server myutn-50 myutn-52 myutn-54 myutn-120 myutn-130 myutn-150 Dongleserver auch für virtualisierte Umgebungen 2 3 Für jeden Anspruch
MehrShadowProtect 4 Backup Fast, Recover Faster
ShadowProtect 4 Backup Fast, Recover Faster Schnelles und zuverlässiges Disaster Recovery, Datenschutz, System Migration und einfachere Verwaltung von Microsoft Systemen Üebersicht Nutzen / Vorteile Wie
MehrSANTEC Video Technologies Professionelle Lösungen für mehr Sicherheit
1 SANTEC Video Technologies Professionelle Lösungen für mehr Sicherheit Videoüberwachung Netzwerktechnik IR-Freilandsensorik Dienstleistungen Pivot3 Ressourcen sparen mit Pivot3 Server-/Storage-Lösungen
MehrUmgang mit der Software ebuddy Ändern von IP Adresse, Firmware und erstellen von Backups von ewon Geräten.
ewon - Technical Note Nr. 001 Version 1.3 Umgang mit der Software ebuddy Ändern von IP Adresse, Firmware und erstellen von Backups von ewon Geräten. 19.10.2006/SI Übersicht: 1. Thema 2. Benötigte Komponenten
Mehr2 Die Terminaldienste Prüfungsanforderungen von Microsoft: Lernziele:
2 Die Terminaldienste Prüfungsanforderungen von Microsoft: Configuring Terminal Services o Configure Windows Server 2008 Terminal Services RemoteApp (TS RemoteApp) o Configure Terminal Services Gateway
MehrSFTP SCP - Synology Wiki
1 of 6 25.07.2009 07:43 SFTP SCP Aus Synology Wiki Inhaltsverzeichnis 1 Einleitung 1.1 Grundsätzliches 2 Voraussetzungen 2.1 Allgemein 2.2 für SFTP und SCP 3 Installation 3.1 Welche openssl Version 3.2
MehrKonfiguration VLAN's. Konfiguration VLAN's IACBOX.COM. Version 2.0.1 Deutsch 01.07.2014
Konfiguration VLAN's Version 2.0.1 Deutsch 01.07.2014 In diesem HOWTO wird die Konfiguration der VLAN's für das Surf-LAN der IAC-BOX beschrieben. Konfiguration VLAN's TITEL Inhaltsverzeichnis Inhaltsverzeichnis...
MehrFirmware-Update, CAPI Update
Produkt: Modul: Kurzbeschreibung: Teldat Bintec Router RT-Serie Firmware-Update, CAPI Update Diese Anleitung hilft Ihnen, das nachfolgend geschilderte Problem zu beheben. Dazu sollten Sie über gute bis
MehrVerwendung des IDS Backup Systems unter Windows 2000
Verwendung des IDS Backup Systems unter Windows 2000 1. Download der Software Netbackup2000 Unter der Adresse http://www.ids-mannheim.de/zdv/lokal/dienste/backup finden Sie die Software Netbackup2000.
MehrKleine Speichersysteme ganz groß
Kleine Speichersysteme ganz groß Redundanz und Performance in Hardware RAID Systemen Wolfgang K. Bauer September 2010 Agenda Optimierung der RAID Performance Hardware-Redundanz richtig nutzen Effiziente
MehrLizenzen auschecken. Was ist zu tun?
Use case Lizenzen auschecken Ihr Unternehmen hat eine Netzwerk-Commuterlizenz mit beispielsweise 4 Lizenzen. Am Freitag wollen Sie Ihren Laptop mit nach Hause nehmen, um dort am Wochenende weiter zu arbeiten.
MehrFunktion rsync mit den actinas Cube Systemen.
Funktion rsync mit den actinas Cube Systemen. Unternehmen haben oft keine ausgebildete IT Abteilung. Trotzdem oder gerade deshalb sind Backups so wichtig, denn das ist im Falle eines Datenverlustes, Ihre
MehrNEWSLETTER // AUGUST 2015
NEWSLETTER // AUGUST 2015 Kürzlich ist eine neue Version von SoftwareCentral erschienen, die neue Version enthält eine Reihe von Verbesserungen und neuen Funktionen die das Arbeiten mit SCCM noch einfacher
MehrMachen Sie Ihr Zuhause fit für die
Machen Sie Ihr Zuhause fit für die Energiezukunft Technisches Handbuch illwerke vkw SmartHome-Starterpaket Stand: April 2011, Alle Rechte vorbehalten. 1 Anbindung illwerke vkw HomeServer ins Heimnetzwerk
MehrUm dies zu tun, öffnen Sie in den Systemeinstellungen das Kontrollfeld "Sharing". Auf dem Bildschirm sollte folgendes Fenster erscheinen:
Einleitung Unter MacOS X hat Apple die Freigabe standardmäßig auf den "Public" Ordner eines Benutzers beschränkt. Mit SharePoints wird diese Beschränkung beseitigt. SharePoints erlaubt auch die Kontrolle
Mehr10.3.1.9 Übung - Konfigurieren einer Windows Vista-Firewall
5.0 10.3.1.9 Übung - Konfigurieren einer Windows Vista-Firewall Drucken Sie diese Übung aus und führen Sie sie durch. In dieser Übung werden Sie erfahren, wie man die Windows Vista-Firewall konfiguriert
MehrFrederik Wagner Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften
Erfahrungen mit Single-Namespace NFS im HPC-Umfeld Frederik Wagner Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften Das Linux-Cluster am LRZ 2 Speichersysteme am Linux-Cluster Homeverzeichnisse
MehrQuickstep Server Update
Quickstep Server Update Übersicht Was wird aktualisiert Update einspielen intersales stellt das Quickstep Entwicklungs- und Ablaufsystem auf eine aktuelle Version um. Hierfür ist es erforderlich, Ihre
MehrStundenerfassung Version 1.8 Anleitung Arbeiten mit Replikaten
Stundenerfassung Version 1.8 Anleitung Arbeiten mit Replikaten 2008 netcadservice GmbH netcadservice GmbH Augustinerstraße 3 D-83395 Freilassing Dieses Programm ist urheberrechtlich geschützt. Eine Weitergabe
MehrVodafone Conferencing Meeting erstellen
Vodafone User Guide Vodafone Conferencing Meeting erstellen Ihre Schritt-für-Schritt Anleitung für das Erstellen von Meetings Kurzübersicht Sofort verfügbare Telefon- und Webkonferenzen mit Vodafone Der
MehrKurzanleitung zur Softwareverteilung von BitDefender Produkten...2
Kurzanleitung zur Softwareverteilung von Kurzanleitung zur Softwareverteilung von BitDefender Produkten...2 I. BitDefender Management Agenten Verteilung...2 1.1. Allgemeine Bedingungen:... 2 1.2. Erste
MehrFragen und Antworten. Kabel Internet
Fragen und Antworten Kabel Internet Inhaltsverzeichnis Inhaltsverzeichnis...II Internetanschluss...3 Kann ich mit Kabel Internet auch W-LAN nutzen?...3 Entstehen beim Surfen zusätzliche Telefonkosten?...3
MehrHTBVIEWER INBETRIEBNAHME
HTBVIEWER INBETRIEBNAHME Vorbereitungen und Systemvoraussetzungen... 1 Systemvoraussetzungen... 1 Betriebssystem... 1 Vorbereitungen... 1 Installation und Inbetriebnahme... 1 Installation... 1 Assistenten
Mehrrepostor möchte Ihre TCO senken
repostor möchte Ihre TCO senken In diesem Dokument informieren wir Sie über unsere Leistungen in folgenden Bereichen: ROI (Return on Investment = Kapitalerträge) Bis zu 43-fache Platzersparnis TCO (Total
MehrWie verbinde ich ein JBOD-System mit dem QStore QMX? - 1
Wie verbinde ich ein JBOD-System mit dem QStore QMX? In diesem Handbuch erläutern wir Ihnen, wie Sie ein JBOD-System an Ihr QStor QMX Gerät anschließen und das RAID Set über das RAID-Controller BIOS einstellen/verwalten
MehrBackup Premium Kurzleitfaden
Info Memeo Backup Premium bietet viele fortschrittliche automatische Backup-Funktionen und ist großartig für Benutzer von Digitalkameras und für Anwender, die bis zu 50.000 Dateien mit Backups sichern
MehrAnti-Botnet-Beratungszentrum. Windows XP in fünf Schritten absichern
Windows XP in fünf Schritten absichern Inhalt: 1. Firewall Aktivierung 2. Anwendung eines Anti-Virus Scanner 3. Aktivierung der automatischen Updates 4. Erstellen eines Backup 5. Setzen von sicheren Passwörtern
MehrInstallation der SAS Foundation Software auf Windows
Installation der SAS Foundation Software auf Windows Der installierende Benutzer unter Windows muss Mitglied der lokalen Gruppe Administratoren / Administrators sein und damit das Recht besitzen, Software
MehrFormular»Fragenkatalog BIM-Server«
Formular»Fragenkatalog BIM-Server«Um Ihnen so schnell wie möglich zu helfen, benötigen wir Ihre Mithilfe. Nur Sie vor Ort kennen Ihr Problem, und Ihre Installationsumgebung. Bitte füllen Sie dieses Dokument
MehrDynDNS Router Betrieb
1. Einleitung Die in dieser Information beschriebene Methode ermöglicht es, mit beliebige Objekte zentral über das Internet zu überwachen. Es ist dabei auf Seite des zu überwachenden Objektes kein PC und/oder
Mehr2 Datei- und Druckdienste
Datei- und Druckdienste 2 Datei- und Druckdienste Lernziele: Verteiltes Dateisystem (DFS) Dateiserver Ressourcen Manager (FSRM) Verschlüsseln Erweiterte Überwachung Prüfungsanforderungen von Microsoft:
MehrMSXFORUM - Exchange Server 2003 > Backup (Sicherung von Exchange 2003)
Page 1 of 10 Backup (Sicherung von Exchange 2003) Kategorie : Exchange Server 2003 Veröffentlicht von webmaster am 21.02.2005 Die Implementierung eines Backups für die Exchange Server, ist einer der wichtigsten
MehrTechnische Anwendungsbeispiele
Technische Anwendungsbeispiele NovaBACKUP NAS Ihre Symantec Backup Exec Alternative www.novastor.de 1 Über NovaBACKUP NAS NovaBACKUP NAS sichert und verwaltet mehrere Server in einem Netzwerk. Die Lösung
MehrInstallationsanleitung Webhost Windows Flex
Installationsanleitung Webhost Windows Flex Stand März 2014 Inhaltsverzeichnis 1. Zugangsdaten & Login... 3 2. Passwort ändern... 4 3. Leistungen hinzufügen / entfernen... 6 4. Datenbanken anlegen / entfernen...
MehrHowTo: Einrichtung & Management von APs mittels des DWC-1000
HowTo: Einrichtung & Management von APs mittels des DWC-1000 [Voraussetzungen] 1. DWC-1000 mit Firmware Version: 4.1.0.2 und höher 2. Kompatibler AP mit aktueller Firmware 4.1.0.8 und höher (DWL-8600AP,
MehrProxmox VE - mit OpenSource Virtualisierung leicht gemacht
Proxmox VE - mit OpenSource Virtualisierung leicht gemacht Was ist Proxmox VE? Das VE steht für Virtualisierungs Environment, also eine Software um Rechner zu virtualisieren und diese auch zu verwalten
MehrDiese Produkte stehen kurz vor end of support 14. Juli 2015. Extended Support
Diese Produkte stehen kurz vor end of support Extended Support endet 14. Juli 2015 Produkt Bestandteile Extended Support End Datum Exchange Server 2003 Standard Edition 8. April 2014 Windows SharePoint
MehrTeamViewer App für Outlook Dokumentation
TeamViewer App für Outlook Dokumentation Version 1.0.0 TeamViewer GmbH Jahnstr. 30 D-73037 Göppingen www.teamviewer.com Inhaltsverzeichnis 1 Installation... 3 1.1 Option 1 Ein Benutzer installiert die
MehrBackup der Progress Datenbank
Backup der Progress Datenbank Zeitplandienst (AT): Beachten Sie bitte: Die folgenden Aktionen können nur direkt am Server, vollzogen werden. Mit Progress 9.1 gibt es keine Möglichkeit über die Clients,
MehrFTP Server unter Windows XP einrichten
Seite 1 von 6 FTP Server unter Windows XP einrichten Es gibt eine Unmenge an komerziellen und Open Source Software die auf dem File Transfer Protocol aufsetze Sicherlich ist das in Windows enthaltene Softwarepaket
MehrKonfiguration Zentyal 3.3 Inhaltsverzeichnis
Konfiguration Zentyal 3.3 Inhaltsverzeichnis Installation... 2 Grundkomponenten... 5 Grundkonfiguration... 6 Netzwerk... 6 Domain... 7 Updates installieren... 8 DNS konfigurieren... 10 Anpassungen in DNS
MehrOSL Storage Cluster und RSIO unter Linux Storage-Attachment und Hochverfügbarkeit in 5 Minuten
OSL Storage Cluster und RSIO unter Linux Storage-Attachment und Hochverfügbarkeit in 5 Minuten OSL Technologietage Berlin 12./13. September 2012 Christian Schmidt OSL Gesellschaft für offene Systemlösungen
MehrSpeicher in der Cloud
Speicher in der Cloud Kostenbremse, Sicherheitsrisiko oder Basis für die unternehmensweite Kollaboration? von Cornelius Höchel-Winter 2013 ComConsult Research GmbH, Aachen 3 SYNCHRONISATION TEUFELSZEUG
MehrSystemvoraussetzungen
Systemvoraussetzungen Gültig ab Stotax Update 2016.1 Stand 03 / 2015 1 Allgemeines... 2 2 Stotax Online Variante (ASP)... 2 3 Stotax Offline Variante (Inhouse)... 3 3.1 Einzelplatz... 3 3.1.1 Hardware...
MehrDatenbank-Verschlüsselung mit DbDefence und Webanwendungen.
Datenbank-Verschlüsselung mit DbDefence und Webanwendungen. In diesem Artikel werden wir Ihnen zeigen, wie Sie eine Datenbank verschlüsseln können, um den Zugriff einzuschränken, aber trotzdem noch eine
MehrWindows Server 2012 RC2 konfigurieren
Windows Server 2012 RC2 konfigurieren Kurzanleitung um einen Windows Server 2012 als Primären Domänencontroller einzurichten. Vorbereitung und Voraussetzungen In NT 4 Zeiten, konnte man bei der Installation
MehrTestplan. Hochschule Luzern Technik & Architektur. Software Komponenten FS13. Gruppe 03 Horw, 16.04.2013
Software Komponenten FS13 Gruppe 03 Horw, 16.04.2013 Bontekoe Christian Estermann Michael Moor Simon Rohrer Felix Autoren Bontekoe Christian Studiengang Informatiker (Berufsbegleitend) Estermann Michael
MehrInstallationsanleitung dateiagent Pro
Installationsanleitung dateiagent Pro Sehr geehrter Kunde, mit dieser Anleitung möchten wir Ihnen die Installation des dateiagent Pro so einfach wie möglich gestalten. Es ist jedoch eine Softwareinstallation
Mehr10.3.1.4 Übung - Datensicherung und Wiederherstellung in Windows 7
5.0 10.3.1.4 Übung - Datensicherung und Wiederherstellung in Windows 7 Einführung Drucken Sie diese Übung aus und führen Sie sie durch. In dieser Übung werden Sie die Daten sichern. Sie werden auch eine
MehrKurzanleitung. MEYTON Aufbau einer Internetverbindung. 1 Von 11
Kurzanleitung MEYTON Aufbau einer Internetverbindung 1 Von 11 Inhaltsverzeichnis Installation eines Internetzugangs...3 Ist mein Router bereits im MEYTON Netzwerk?...3 Start des YAST Programms...4 Auswahl
MehrANLEITUNG NETZEWERK INSTALATION
ANLEITUNG NETZEWERK INSTALATION Sehr geehrter Kunde, vielen Dank, dass Sie sich für RED CAD entschieden haben. Mit dieser Anleitung möchten wir Sie bei der Installation unterstützen. Die Netzwerkinstallation
MehrWINDOWS 8 WINDOWS SERVER 2012
WINDOWS 8 WINDOWS SERVER 2012 IT Fachforum 2012 :: 24.09.-27.09.2012 Andreas Götzfried IT Fachforum::Agenda Windows 8 Windows Server 2012 Zertifizierung WINDOWS 8 Schöne neue Welt Andreas Götzfried Windows
MehrVerwendung des Terminalservers der MUG
Verwendung des Terminalservers der MUG Inhalt Allgemeines... 1 Installation des ICA-Client... 1 An- und Abmeldung... 4 Datentransfer vom/zum Terminalserver... 5 Allgemeines Die Medizinische Universität
MehrPreise und Leistungen Dynamic Computing Services
Preise und Leistungen Dynamic Computing Services Alle Preise in CHF exkl. MwSt. beim Bezug während 30 Tagen. Die effektive Verrechnung findet auf Tagesbasis statt, unabhängig von der Nutzungsdauer während
MehrSimplify Business continuity & DR
Simplify Business continuity & DR Mit Hitachi, Lanexpert & Vmware Georg Rölli Leiter IT Betrieb / Livit AG Falko Herbstreuth Storage Architect / LANexpert SA 22. September 2011 Agenda Vorstellung Über
Mehr