Effektive Crashdump-Analyse. Analyse. DECUS IT-Symposium VMS 1G06. Was ist ein System-Crash?

Ähnliche Dokumente
Effektive Crashdump-Analyse

Errlog-Analyse unter OpenVMS

Availability Manager Overview

Archive / Backup System für OpenVMS

VMWare 3.0. Vmware Installation: - Install VMWARE. - c:\ Programme \ VMWARE. - CD Autorun disable / ja

Crash-Analyse mit SDA

Solaris im Datacenter Architektur, Implementation und Betrieb

Analyse System/Process Hangs. Process. Hangs. Analyse System/Process. Hangs. Benutzung von SDA Forced. Forced Crash/Hang Beispiel.

Teil 1: CSWS Update, Konfiguration (Information von Hans Bachner,, HP Austria) CSWS im DECUSnet

Switching. Übung 2 System Management. 2.1 Szenario

OpenVMS/VAX Notizen. Thomas Strathmann. 19. April 2010

RMAN Duplicate. von. dbtotal.de. Jaroslav Dutov.

System & Performance Management mit DECamds. DECamds. Themen. DECamds. DECamds. DECamds. OV113 - System and Performance Management with DECamds

Isabel Arnold CICS Technical Sales Germany z/os Explorer IBM Corporation

RMS-Tuning nach 4 Jahren

p^db=`oj===pìééçêíáåñçêã~íáçå=

Free MC Boot per PS1 Exploit installieren

DHCP. DHCP Theorie. Inhalt. Allgemein. Allgemein (cont.) Aufgabe

AFS Backup und Recover nicht nur für (Legato) NetWorker

Checkliste. Verantwortlich: Benedikt Pawletta K-SIPE-2 Status:

Wo finde ich die Software? - Jedem ProLiant Server liegt eine Management CD bei. - Über die Internetseite

Installation von 3M KODIP-SF mit Fallerfassung Version Dezember 2016

Linux basierendes NAS auf Seagate Goflex Net installieren. Christian Eppler 21162, Stefan Möbius 21165

Anleitung zur Inbetriebnahme eines SQ-Robotersystems

Produkt-Download für NX

Zum Download von ArcGIS 10, 10.1 oder 10.2 die folgende Webseite aufrufen (Serviceportal der TU):

PPL 10 Installationsanleitung

SINAMICS Intelligent Operator Panel (IOP)

SINAMICS Intelligent Operator Panel (IOP)

Threads. Netzwerk - Programmierung. Alexander Sczyrba Jan Krüger

Agenda. FRA Was ist das? Warum sollte die FRA genutzt werden? FRA INIT Paramter Verzeichnisstruktur (Beispiel) Überwachung der Flash Recovery Area

Marketing Update. Enabler / ENABLER aqua / Maestro II

Tube Analyzer LogViewer 2.3

Installation und Einrichtung unter Windows 7/8/10. Installation and configuration for Windows 7/8/10

JTAGMaps Quick Installation Guide

Veeam Availability Suite. Thomas Bartz System Engineer, Veeam Software

PacketWise Update mit zeitgesteuerter Reset Funktion created by: Rainer Bemsel Version 1.0 Dated: Nov/08/2008

OpenVMS virtualisiert auf x86 und x86-64

GWT-Webportal Update. ACCENON Software und Hardware GmbH

DCL/Utilities in the 3rd Millenium 1G02. Agenda

am besten erst den ganzen Abschnitt lesen, besonders das mit dem patch!

Installation / Update Advantage Database Server. Die Software Hausverwaltung

Oracle Database 12c: Install and Upgrade

EMCO Installationsanleitung / Installation instructions

Web-Browser. Web-Server unter OpenVMS. Inhalt. Server. Netscape Fasttrack Web Server. Netscape Fasttrack WebServer. Web - Server.

Inbetriebnahme einer lokal installierten Demoversion von VuFind

Open Source Data Center Virtualisierung mit OpenNebula LinuxTag Berlin. Bernd Erk

Hier folgt eine kurze Aufstellung über die verwendete Architekur. Die Angaben sind ohne Gewähr für Vollständigkeit oder vollständige Richtigkeit.

Fehlercodes an der Maschine

Fileserver basierte Installation von OpenRoad

Betriebssysteme VO Betriebssysteme KU

Konfigurieren eines HHR Gerät, um es über eine CBX800 an Profibus anzubinden

Im Kapitel Resourc Manager werden die verschiedenen Möglichkeiten der Überwachung von Messwerten eines Server oder Benutzers erläutert.

clevere ACL Filter Funktionen mit gemanagten Small Business Switches clusterbare Access-Points für flächendeckendes WLAN

Oracle Database 10g RAC Plattformen im Detail

Datenbankreplikation in der Standard Edition. Markus Jendrossek

SAFE HARBOR STATEMENT

check_cisco_voice Dokumentation

Installation - Optimierung und Fehleranalyse

CADEMIA: Einrichtung Ihres Computers unter Windows

Löschen eines erkannten aber noch nicht konfigurierten Laufwerks

PC: Virtualisierung und Konservierung

Softwareanforderungen für Microsoft Dynamics CRM Server 2015

Administrations Handbuch SEPsesam SAP R/3 BACKUP. Rainer Seyerlein SEP AG Weyarn

Open Source Data Center Virtualisierung mit OpenNebula CeBIT Bernd Erk

Linux System Administration Inhouse Training

Modern Windows OS Deployment

ColdFusion Konfiguration für den Betrieb mit hyscore. ColdFusion Administrator. Notwendige Konfiguration für hyscore. PDF-Dokument: config_cf10.

Macrium Reflect Freeware-Tutorial:


How to create a Gift Certificate Wie man ein Gift Certificate (Gutschein) erstellt

Einführung Leistungsmerkmale Aufbau am Beispiel FAT16. Das Filesystem FAT. Peter Schmid. Hochschule für Technik Zürich Studiengang Informatik

1A05 64-bit Adressierung unter Alpha OpenVMS

Oracle ACFS / CloudFS zuverlässig nutzbar?

Der Adapter Z250I / Z270I lässt sich auf folgenden Betriebssystemen installieren:

Einrichten eines Client Schedulers

1.1 IPSec - Sporadische Panic

NEUIGKEITEN SAS 9.4 ARCHITEKTUR PHILLIP MANSCHEK

Git - Fast Version Control System

PG5 Starter Training Webeditor 8 Applikation Daniel Ernst DE

Securepoint Security Systems

Installation von NetBeans inkl. Glassfish Anwendungs-Server

Lösungen rund um das Zentrum der Virtualisierung

Neuigkeiten in Microsoft Windows Codename Longhorn Egon Pramstrahler - egon@pramstrahler.it

Smartphone Entwicklung mit Android und Java

Zwei Möglichkeiten die TLB zu aktualisieren

Leitfaden für die Installation von C-MOR in einer Virtuellen Maschine Experten Installation mit eigener Partitionierung ab Version 5.

C A L D E R A G R A P H I C S

Ora Education GmbH. Lehrgang: Oracle Application Server 10g R3: Administration

Aktualisierung von ArcGIS Desktop 10.0 Single Use Lizenzen auf die Version ArcGIS 10.1 for Desktop

Windows Server Dieses Dokument beschreibt einige Details zum Aufsetzen eines Windows Server 2003 (Andres Bohren /

Installation des GeoShop Redirector für Apache (Stand ) ================================================================

BartPE. Dokumentation. Projektarbeit Network Services. Dozent: Wolf-Fritz Riekert. Belmondo Kovac. Autor: Andreas Dinkelacker, 3.

Anleitung für das SiS RAID-Programm unter Windows XP / 2000

Hosting Exchange 2007 SP1

Sicheres C Programmieren in Embedded Systemen ARM II (ARM7TMDI [1] ) Wintersemester

1.1 Datenbankprogramm Oracle für MCIS MDA

DECUSnet Konfiguration. IT-Symposium Alphaserver 2100 OpenVMS V TCPIP-Services

MATLAB driver for Spectrum boards

EMCO Installationsanleitung Installation instructions

Transkript:

Effektive Crashdump- Analyse DECUS IT-Symposium VMS 1G06 Volker.Halle@invenate.de 05-APR APR-2005 Effektive Crashdump-Analyse Was ist ein System-Crash? Ursachen für f System-Crashes System-Crash: System-Parameter und Dumpfile Was kommt nach dem Crash? Do you have any CLUE? Crash-CallCall Logging Crash-Analyse mit CCAT Analyse von SYSDUMP.DMP www.decus.de 1

Was ist ein System-Crash? Zitate: spontaner Neustart plötzlich sind alle User rausgeflogen der Bildschirm wurde plötzlich blau gestern war die System Uptime noch 90 Tage Was ist ein System-Crash OpenVMS erkennt Inkonsistenzen im Betriebssystem Unexpected Exception - Zugriff auf ungültige virtuelle Adressen Internal Data Structure Corruption - Überprüfung von internen Datenstrukturen Bei Inkonsistenzen im KERNEL des Betriebs-Systems wird ein Bugcheck erzeugt: - System Crash www.decus.de 2

Was ist ein System-Crash...? Bugcheck-Information wird auf Console Terminal ausgegeben System Memory wird auf Platte geschrieben (SYSTEM DUMP) System startet automatisch neu (REBOOT) Was ist KEIN System-Crash? System HALT >>> HALT instruction im Kernel Mode Kernel Stack not valid HALT >>> SET AUTO_ACTION RESTART System Soft(ware) ) Hang Control-P oder HALT-Knopf >>> CRASH System Hard(ware) ) Hang keine Reaktion auf HALT oder RESTART-Knopf www.decus.de 3

Warum ein System-Crash? Zum Schutz der Anwender-Daten! Wiederherstellung der Konsistenz im Betriebs- System (durch Crash und Reboot) Dokumentation des System-Zustands für f Fehleranalyse Ursachen für f System-Crashes Datenstruktur-Inkonsistenzen im Betriebs- System durch Coding Errors im Betriebs-System oder in privilegierten (CMKRNL) Programmen/Drivern Hardware/Firmware Fehler (selten!) Fehlbedienung durch privilegierte Benutzer (sehr selten!!) www.decus.de 4

Voraussetzungen für f r System-Dumps System Parameter steuern das Verhalten bei einem System Bugcheck System Dump File notwendig zum Abspeichern des System Memory bei einem System Crash System-Crash - System-Parameter DUMPBUG = 1 =1 Dumpfile wird geschrieben (default( default) =0 kein Dumpfile schreiben SAVEDUMP = 0 (bei Dump in PAGEFILE.SYS) =0 Pagefile-Space automatisch freigeben =1 Dump im Pagefile nicht automatisch freigeben $ ANAL/CRASH SYS$SYSTEM:PAGEFILE.SYS SDA> COPY dir:[dev]crash.dmp $ ANAL/CRASH/RELEASE SYS$SYSTEM:PAGEFILE.SYS www.decus.de 5

System-Crash - System-Parameter... DUMPSTYLE = 9 Bit 0: 0 = Full Dump, 1 = Selective Bit 1: 0 = Minimal Console Output, 1 = Full Output Bit 2: 0 = Dump auf System-Disk, 1 = DOSD Bit 3: 0 = no compression,, 1 = Compressed dump DUMPFILE=n (in MODPARAMS.DAT) = 0 AUTOGEN Dumpfile-Sizing ausschalten = n Grösse des Dumpfiles in Blocks System-Crash - System-Parameter... BUGCHECKFATAL = 0 = 0 kein Crash bei non-fatal Bugcheck Es wird nur ein Errlog-Entry Entry (non-fatal bugcheck) erzeugt (meist EXEC-Mode, z.b. RMS). = 1 System-Crash bei non-fatal Bugcheck $ MC SYSGEN SYSGEN> USE ACTIVE SYSGEN> SET BUGCHECKFATAL 1 SYSGEN> WRITE ACTIVE www.decus.de 6

System-Crash - System- Parameter... BUGREBOOT = 1 0 = kein automatischer Reboot nach Crash 1 = automatischer Reboot nach System Crash System-Crash - Dumpfile System Dumpfile wird beim Booten gemapped Ausnahme: DOSD unter OpenVMS Alpha NIEMALS löschenl Grösse ändern mit: SYSGEN> CREATE file/size=n oder @AUTOGEN Reboot und evtl. PURGE entfernen mit: $ RENAME SYSDUMP.DMP SYSDUMP.OLD Reboot $ DELETE SYSDUMP.OLD; www.decus.de 7

System-Crash - Dumpfile... SYS$SYSTEM:SYSDUMP.DMP muss in SYS$SPECIFIC:[SYSEXE] existieren SYS$SYSTEM:PAGEFILE.SYS wenn kein SYSDUMP.DMP vorhanden SAVEDUMP=1 setzen beim Startup: : SDA> COPY/COMPRESS dev:[dir]file.dmp System-Crash - Dumpfile... COMMON_SYSDUMP.DMP im Cluster Berechnung der Grösse des Dumpfiles mit: @AUTOGEN GETDATA TESTFILES... A nnnnn block dump file would have been created SYSGEN> CREATE SYS$COMMON:[SYSEXE]SYSDUMP-COMMON.DMP COMMON.DMP - /SIZE=nnnnn $ SET FILE SYS$COMMON:[SYSEXE]SYSDUMP-COMMON.DMP COMMON.DMP - /ENTER=SYS$SYSDEVICE:[SYSn.SYSEXE]SYSDUMP.DMP DUMPFILE=0 in allen MODPARAMS.DAT, um Dumpfile Auto-Sizing durch AUTOGEN zu verhindern www.decus.de 8

System-Crash - Dumpfile... DOSD Dump Off System Disk (OpenVMS Alpha) disk:[sysn.sysexe]sysdump.dmp DUMPSTYLE - Set Bit 2 Mount DOSD Disk in SYLOGICALS.COM: MOUNT/SYS/NOASSIST disk label CLUE$DOSD_DEVICE oder DEFINE/SYSTEM CLUE$DOSD_DEVICE disk >>> SET DUMP_DEV DKAx MODPARAMS.DAT: DUMPFILE_DEVICE= $n$dkax $n$dkax: DUMP_DEV Console Variable alle möglichen m Pfade zur System/Dump-Disk Disk eintragen max. 4 Einträge möglichm zuerst DOSD-Disk Disk (falls vorhanden), dann System-Disk (wegen SYS$ERRLOG.DMP) >>> SET DUMP_DEV DGA0.1001,DGA0.1002,DGB0.1003,DGB0.1004 www.decus.de 9

Was kommt nach dem Crash? Automatischer Reboot (BUGREBOOT=1) Automatische Erzeugung des Crash-Footprints OpenVMS Alpha: CLUE$COLLECT:CLUE$node_ddmmyy_hhmm.LIS OpenVMS VAX: CLUE$OUTPUT:CLUE$LAST_node.LIS Crash-Analyse Analyse auf Basis des CLUE-Files Crash-Analyse mit SDA Do you have any CLUE? CLUE = Crash Log Utility Extractor erzeugt automatisch Crash Footprint File aus dem System Dump File wichtigste Informationen über den System Crash Datei in Text-Format klein (50.-100. Blocks) lesbar per e-mail leicht zu versenden www.decus.de 10

Do you have any CLUE...? Implementation OpenVMS Alpha seit V6.1 SDA Extension: SYS$SHARE:CLUE$SDA.EXE SDA> CLUE HELP OpenVMS VAX seit V6.0 SYS$SYSTEM:CLUE.EXE $ CLUE:==$CLUE $ CLUE HELP Do you have any CLUE...? OpenVMS Alpha Crash Historie (letzte 50 Crashes im Cluster) $ TYPE CLUE$HISTORY! 132 columns Date Version System/CPU Node Bugcheck Process PC Module Offset ----------------- -------- ------------------- ------ ------------ --------------- -------- ----------------------- --- 14-JUL JUL-1999 18:09 V7.1 DEC 3000 - M300X HAN INVEXCEPTN HALLE 8018E210 SYS$NETWORK_SERVICES 00006210 15-JUL JUL-1999 13:44 V7.1 DEC 3000 - M300X HAN INVEXCEPTN FISCHER 8018E210 SYS$NETWORK_SERVICES 00006210 09-SEP SEP-1999 09:29 V7.1 DEC 3000 - M300X HAN INCONSTATE NULL 8022CB7C SYS$PKCDRIVER 00008B7C 13-DEC DEC-1999 12:35 V7.1 DEC 3000 - M300X HAN OPERATOR _TNA148: 0003060C OPCCRASH 0003060C 21-SEP SEP-2000 2000 10:33 V7.1 DEC 3000 - M300X HAN OPERCRASH NULL 8009B220 PROCESS_MANAGEMENT 00001220 10-NOV NOV-2000 11:13 V7.1 DEC 3000 - M300X HAN OPERCRASH NULL 8009B164 PROCESS_MANAGEMENT 00001164 www.decus.de 11

Do you have any CLUE...? OpenVMS Alpha Footprints der letzten Crashes: $ DIR CLUE$COLLECT:CLUE$node*.LIS $ TYPE CLUE$COLLECT:CLUE$node_ddmmyy_hhmm.LIS CLUE Troubleshooting: CLUE File wird erzeugt im Prozess CLUE$SDA beim Startup Fehlermeldungen sind in: $ TYPE SYS$MANAGER:CLUE$STARTUP.LOG Do you have any CLUE...? Crash Time: 9-SEP9 SEP-1999 09:29:25.04 Bugcheck Type: INCONSTATE, Inconsistent I/O data base Node: : HAN (Standalone( Standalone) CPU Type: DEC 3000 - M300X VMS Version: V7.1 Current Process: : NULL Current Image: <not< available> Failing PC: FFFFFFFF.8022CB7C SYS$PKCDRIVER_NPRO+08B7C Failing PS: 18000000.00001504 Module: SYS$PKCDRIVER Offset: : 00008B7C Boot Time: 7-SEP7 SEP-1999 13:04:02.00 System Uptime: : 1 20:25:23.04 www.decus.de 12

Do you have any CLUE...? OpenVMS VAX Crash Historie (letzte 100 Crashes & Shutdowns): $ CLUE/DISPLAY # Node Time Type Process Name Module Offset 1 RF4 9-FEB9 FEB-1998 00:12 CLUEXIT NONE CLUSTRLOA AF7 2 RF4 8-FEB8 FEB-1998 19:57 CLUEXIT NONE CLUSTRLOA AF7 3 RF4 8-FEB8 FEB-1998 19:46 CLUEXIT NONE CLUSTRLOA AF7 4 RF4 7-FEB7 FEB-1998 20:01 OPERATOR _OPA0: UNKNOWN 0 Problem mit CLUE$OUTPUT:CLUE$HISTORY.DATA (Illegal Format) unter OpenVMS VAX V7.2: Lösung L verfügbar (Referenz: CFS.70650) Do you have any CLUE...? OpenVMS VAX: CLUE File des letzten Crashes: $ TYPE CLUE$OUTPUT:CLUE$LAST_node.LIS vorherige Crashes: $ CLUE/DISPLAY CLUE> n! zeigt CANASTA Parameter CLUE> SHOW ALL n! zeigt alle CLUE Daten www.decus.de 13

Do you have any CLUE...? Canasta Parameters: VMS Version : 7.1 Crash Type : CLUEXIT Current Process : NONE Current Image : NONE CPU Type : 4000-60 SID : 12000003 Signal Array Cnt : 0 Exception par #1 : FFFFFFFF Exception par #2 : FFFFFFFF Exception par #3 : FFFFFFFF Exception PC : 826BDAF7 Exception PSL : 04080000 Failing Inst Code Module Offset : BUGW : CLUSTRLOA : AF7 (am Ende des OpenVMS VAX CLUE Files) Do you have any CLUE...? OpenVMS Alpha CLUE Files wichtigstes Tool zur Früherkennung des Crashes zusätzliche Informationen abhängig vom Bugcheck (z.b. bei CPUSPINWAIT Crash) wird ständig weiterentwickelt und verfeinert (z.b. Dekodierung der Register-Inhalte) gibt guten Überblick über Crash-Szenario www.decus.de 14

Peeking at the dump... ANA/CRASH von anderer Maschine (z.b. im Cluster) vor Reboot es wird kein CLUE File erzeugt beim STARTUP %CLUE-I-ALRDYANA, dumpfile has already been analyzed WORARKOUND: $ ANA/CRASH dumpfile SDA> READ/EXEC/NOLOG SDA> CLUE HISTORY/OVERRIDE Crash Call Logging Störungsmeldung nach System Crashes: telefonisch Bugcheck Type, VMS Version, Module+Offset CLUE-File per e-mail an CSC senden elektronisch über CCC elektronisch automatisch über PRS (DSNlink( DSNlink/ISEE) mit CADC (AutoCLUE( AutoCLUE) ) oder WEBES/CCAT www.decus.de 15

Crash Call Logging... Automatisches Crash-Call Call-Logging mit PRS/DSNlink CADC = Crash Analysis Data Collector vormals: AutoCLUE Download von HP Service Tools http://h71025.www7.hp.com/support support/tools/index.asp > WEBES > CCAT > CADC - aktuell V3.0 unterstuetzt PRS (Proactive( Remote Services), DSNlink oder Mail Crash Call Logging... CADC V3.0 Installation mit @VMSINSTAL CADC-OPENVMS 2 Logicals in SYLOGICALS.COM einfügen: $ DEFINE/SYSTEM CADC$PROFILE - SYS$xxx:[CADC]CADC$PROFILE.DAT $ DEFINE/SYSTEM CADC$OUTPUT - SYS$xxx:[CADC] xxx = Installation in SYS$SPECIFIC oder SYS$COMMON www.decus.de 16

CADC... Crash Call Logging... Aufruf im Startup mit @SYS$STARTUP:CADC-OPENVMS falls neues CLUE File existiert, wird Mail an System Manager und PRS/DSNlink gesendet (falls konfiguriert) Automatische Crash-Analyse findet bei HP statt (mit CCAT im Support-Center) Crash-Analyse mit CCAT CCAT = Computer Crash Analysis Tool Bestandteil von WEBES (Web( Web-Based Enterprise Services: CA, CCAT, RCM) auf System Tools CD oder von HP Services aktuell: WEBES V4.4 - ab OpenVMS Alpha V7.2-2 Installation mit @WEBES_INSTAL Do you want to install the Compaq Crash Analyze tool [YES]? Einsatz alternativ zu CADC/AutoCLUE AutoCLUE www.decus.de 17

Crash-Analyse mit CCAT... Crash Knowledge Database (CCAT Rules) ) mit Lösungen von bekannten Crash-Problemen Troubleshooting Informationen Crash-Analyse mit CCAT auf lokalem System keine elektronische Verbindung (CPRS) zu HP notwendig CCAT analysiert CLUE Files Informationen von SDA> CLUE CRASH Crash-Analyse mit CCAT... Crash Knowledge Database (CCAT Rules V4.3) OpenVMS Alpha: 1845 CCAT Rules insgesamt OpenVMS VAX: 2102 CCAT Rules insgesamt Kunde sieht nur CCAT-Rule Rule-ID (z.b. CCAT-V-A-1234) www.decus.de 18

Crash-Analyse mit CCAT... Automatische Crash-Analyse beim Startup Mail an System Manager automatischer Crash-Call Call ueber ISEE, PRS oder DSNlink Manuelle Analyse von CLUE Files $ @SVCTOOLS_HOME:[COMMON.BIN]WCCAT GUI JAVA-basierend. MOTIF User Interface. Eigenes JRE (Java Runtime Environment) ) im CCAT Directory Analyse von SYSDUMP.DMP Dump-Analyse mit SDA $ ANA/CRASH SYS$SYSTEM:SYSDUMP.DMP SDA> HELP und CLUE HELP SDA> CLUE CRASH SDA> COPY/COMPRESS disk:<dir>file.dmp BACKUP/IGNORE=NOBACKUP!!! SYSDUMP.DMP ist auf /NOBACKUP per Default $ DIR/FULL zeigt: Backups disabled www.decus.de 19

Effektive Crashdump-Analyse System Dumpfile und System-Parameter korrekt konfigurieren >>> SET AUTO_ACTION RESTART zum Aufzeichnen von Restart-Crashes WRITE SYS$OUTPUT F$GETENV( AUTO_ACTION AUTO_ACTION ) ISEE/PRS/ ISEE/PRS/DSNlink und CCAT/CADC verwenden Informationen aus CLUE File verwenden bei Störungsmeldungen für f Crashes invenate Business & IT Consulting www.decus.de 20