您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 51CTO下载-SUN日常预防性维护手册v1.1(1)
1SUN预防性维护工作文档Version1.1目录巡检过程中注意事项..............................................3巡检时遇到故障如何处理?.........................错误!未定义书签。第一部分:系统硬件运行状况检查..................................41、系统外观检查.................................................42、系统硬件配置.................................................41)处理器......................................................422)内置硬盘配置、状态..........................................53)内存配置....................................................64、系统硬件运行状况.............................................61)处理器运行状态..............................................62)内存运行状态................................................73)硬盘空间占用率是否超出90%..................................84)网络状态....................................................84)钥匙是否妥善保存.............................................95)风扇转动情况................................................105、系统记录信息SystemLogandMessage.........................101)ErrptLog中是否有必须处理的硬件故障纪录...................101)以SE3310/3510存储为例....................................10第二部分:系统软件运行状况检查................................111、系统操作环境................................................111)操作系统版本................................................112)内存使用情况................................................112、数据保护和系统备份..........................................111)SVM..........................................................112)VXVM管理....................................................123)备份磁带是否标记清晰和异地保存.............................124)操作系统ROOT密码是否妥善保管..............................123、cluster模式检查............................................121)双机状态是否正常...........................................12第三部分:总结与反馈..........................................191、本次预防性维护发现的问题...................................192、问题解决和下一步工作计划....................................193、收集更详细的日志发给专业人员................................193预防性维护(巡检)是相对于被动式的维修服务,预防性维护提供对客户的计算环境主动的预防性的检查。通过预见及预防系统可能发生的硬件故障或严重的性能瓶颈等,可以很大程度地提高计算环境的可用性。巡检过程中注意事项4巡检时遇到故障如何处理?如果是属于硬件或者操作系统方面的故障,请准备好设备PN、SN,联系华胜天成8008100583热线或者当地工程师电话报修。以下对维护中的具体内容逐条进行解释:第一部分:系统硬件运行状况检查1、系统外观检查查看主机、阵列面板上是否有repair指示灯呈黄色,如有需进一步确认或者拨打800热线报修。退出命令方式:ctrl+c键,可以退出该命令操作。2、系统硬件配置CPU频率:例,以root用户登陆主机:#/usr/platform/sun4u/sbin/prtdiag–v|more显示如下:Systemclockfrequency:84MHZ显示CPU的时钟速度为84MHzCPU数量:例,以root用户登陆主机:#/usr/platform/sun4u/sbin/prtdiag–v|more显示如下:=====================CPUs====================================E$CPUCPUTemperatureCPUFreqSizeImpl.MaskDieAmbient-----------------------------------------------1)处理器50502MHz256KBUS-IIe1.472C44C2显示系统中CPU的数量为1颗硬盘容量:以root用户登陆主机:#iostat–E显示如下:sd8SoftErrors:0HardErrors:0TransportErrors:0Vendor:FUJITSUProduct:MAN3184MSUN18GRevision:1804SerialNo:0230Z58654RPM:7200Heads:19Size:18.11GB18110967808bytes显示硬盘sd8大小为18G,若HardErrors不为0,则需要观察该盘。硬盘数量:以root用户登陆主机:#formatSearchingfordisks...doneAVAILABLEDISKSELECTIONS:0.c0t0d0SUN18Gcyl7506alt2hd19sec248/pci@1f,4000/scsi@3/sd@0,01.c0t1d0SUN18Gcyl7506alt2hd19sec248/pci@1f,4000/scsi@3/sd@1,02.c1t9d0SUN18Gcyl7506alt2hd19sec248/pci@1f,4000/pci@2/SUNW,isptwo@4/sd@9,03.c1t10d0SUN18Gcyl7506alt2hd19sec248/pci@1f,4000/pci@2/SUNW,isptwo@4/sd@a,02)内置硬盘配置、状态64.c2t9d0SUN36Gcyl24620alt2hd27sec107/pci@1f,4000/pci@4/SUNW,isptwo@4/sd@9,05.c2t10d0SUN18Gcyl7506alt2hd19sec248/pci@1f,4000/pci@4/SUNW,isptwo@4/sd@a,0共5块硬盘,若出现unknown关键字,则表示硬盘有故障。内存容量例,以root用户登陆主机:#/usr/platform/sun4u/sbin/prtdiag–v|more显示如下:===============MemoryConfiguration======================SegmentTable:----------------------------------------------------------BaseAddressSizeInterleaveFactorContains-----------------------------------------------------------0x0256MB1LabelDIMM00x20000000256MB1LabelDIMM1显示系统内存大小为2*256M4、系统硬件运行状况以root用户登陆主机:#psrinfo显示如下:0on-linesince10/24/0411:45:53表示1个cpu,若不显示为on-line,则cpu故障以root用户登陆主机:#vmstat25(间隔2秒显示5次统计数据)3)内存配置1)处理器运行状态7procsmemorypagediskfaultscpurbwswapfreeremfpipofrdesrddf0s0--insycsussyid000741272201352631402200100042949672411002475177800073323224280003000000000306265900100000733232242800000000000003027654001000007332322428000000000000030420520010000073323224280000000000000304165400100显示信息解释如下:r指每秒钟增加到运行队列中的线程数b指每秒钟因等待资源或I/O而被添加到等待队列中的线程数us指CPU处在用户模式销的时间百分比,即用户使用的CPU时间sy指CPU处在系统模式下的时间百分比,即系统内核使用的CPU时间id指CPU空闲的时间百分比,即运行队列是空的如果id一直是0,则说明CPU一直处于繁忙状态运行队列的大小是评估CPU性能的关键因素。当运行队列增大,用户的响应时间就会加大;如果r的值不为零,则说明CPU还有更多的工作要执行如果us+sy小于90%,单用户系统并不关注CPU的限制。如果在多用户系统上us+sy超过了80%,进程可能把时间花在运行队列中等待获得CPU资源上,因此响应时间和吞吐量就变得很小如果在多用户系统上us+sy接近100%,说明可能是CPU的限制2)内存运行状态8以root用户登陆主机#/usr/platform/sun4u/sbin/prtdiag–v|more===================MemoryConfiguration============================SegmentTable:--------------------------------------------------------------------BaseAddressSizeInterleaveFactorContains--------------------------------------------------------------------0x0256MB1LabelDIMM00x20000000256MB1LabelDIMM1若不能看到size大小,则表示内存故障所有分区的使用空间容量如果大于90%,说明磁盘空间即将不够,需要进行无效文件清理。#df-k显示如下文件系统千字节用了可用容量挂接在/dev/dsk/c0t0d0s06191949533063979939187%//proc0000%/procfd0000%/dev/fdmnttab0000%/etc/mnttabswap731200167311841%/var/runswap731208247311841%/tm
本文标题:51CTO下载-SUN日常预防性维护手册v1.1(1)
链接地址:https://www.777doc.com/doc-3368082 .html