您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > sun服务器巡检报告
检查前填写主机位置:主机编号:主机型号:主机用途:检查工程师:江世峰检查日期:2010.4.15检查项目检查操作参考标准机柜或者机器周围的异物观察机柜以及机器周围的是否存在异物是否造成堵塞,导致气流不畅系统风扇运转检查观察并用手感觉进风和出风是否正常主机和磁盘柜的所有风扇运转正常系统运装噪音检查仔细听系统运转声音噪音是否过大,有无异常声音系统电源指示灯检查观察每个电源模块上的指示灯是否正常所有电源指示灯应该都亮。系统其它指示灯检查观察在主机和磁盘阵列正面和背面和上的所有的指示灯的状态。系统无维护灯亮或闪烁,系统无黄或红灯亮或闪烁系统上所配备钥匙以及钥匙开关位置检查系统钥匙上所有钥匙是否齐全以及钥匙开关所处位置系统钥匙齐全,对于双机系统钥匙开关处于电源状态,对于单机系统开关处于安全状态检查网线连接是否正常检查网线与交换之间的连接是否正常,以及心跳网线连接是否正常交换机连接主机的所有端口指示灯为长亮,双机系统的公网与交换机之间的连接应为交叉连接检查交换机的接口情况检查是否有不带标签的网线连接到交换机上正常使用的网线都有标签,不带标签的可能是临时测试使用的,用完应移除检查项目检查操作参考标准查看硬件配置:cpu/usr/platform/sun4u/sbin/prtdiag-v|more可看到cpu个数、主频查看硬件配置:内存/usr/platform/sun4u/sbin/prtdiag-v|more可看到内存的个数和大小,若看不到,则表示内存故障查看硬件配置:本地硬盘iostat-E显示硬盘大小,观察若HardErrors不为0,则需要检查该盘查看整体磁盘空间执行format命令若出现unknown关键字,则表示磁盘有故障网卡状态检查ifconfig-a网卡的flag为UP属正常。同时检查ip地址和netmask是否正确查看路由表netstat-rn查看默认路由是否正确主机连接系统网络情况在其它机器上采用ping命令观察5分钟是否有丢包情况对主机的telnet情况在其它机器上telnet到主机上观察能否正常连接到主机操作系统版本及KJP执行命令uname-a检查操作系统版本及KJP空间使用情况执行df-h没有文件系统超过90%文件系统logging功能more/etc/vfstab检查文件系统mount选项是否有logging参数cd/var/crash/hostname操作系统检查说明:进行以下检查时,需要使用root用户来操作。必须谨慎,不得随意执行其他命令。委门户sun服务器巡检报告检查近期系统的coredump文件没有近期的coredump文件存在设备物理检查ls-lfind/-namecorels-lcorehosts文件检查vi/etc/hosts包含双机节点IP、浮动IP,主备机配置相同,同一个主机名不能对应多个IP地址以root用户用more查看/var/adm/message*及/var/log/syslog*登陆情况检查执行:last记录结果,观察是否被陌生地址登陆过机器系统时间检查执行:date机器时间差不应超过5分CD-ROM的状况检查执行:eject,插入测试光盘CD-ROM被自动mount上检查项目检查操作参考标准卷管理检查执行metadb是否使用SVM进行卷管理检查本地SDS镜像两边是否OKmetastat所有submirror都处于Okay状态,无Maintenance状态检查项目检查操作参考标准查看操作系统版本uname-aSunOSndrcsun25.9Generic_117171-07sun4usparcSUNW,Sun-Fire-V440内存交换区使用情况swap-s总数:分配了336192k字节+保留498088k=已使用834280k,14252064k可用,可用数值不小于100000k即可内存使用检查执行:top空闲内存应大于50M1.系统总进程数应小于200个,2.无僵死(zombie)进程CPU资源检查以root用户执行:topCPU的平均空闲率不应低于25%,单个进程CPU占用率不应超过8%,若有则记录进程名并记录该进程占用CPU超过8%的时间。检查系统在无应用情况下I/O状况#mkfile2000mtestfile记录结果采用vmstat来检查内存使用情况#vmstat520记录结果#netstat-i#netstat-a#netstat-r检查项目检查操作参考标准root密码是否妥善保管向维护人员了解为了安全,用户的root密码应该妥善保管并定期更换是否有系统备份及恢复的措施和文档向维护人员了解有系统备份及恢复的措施和文档并且正确维护是否规范检测磁盘管理软件检查采用netstat来检查网络状况记录结果磁盘IO繁忙度检查输出结果中avque列的值应是0.0,或瞬时大于10.0,不应长时间大于10.0进程数检查1、以root用户执行:top,查看第二行process参数;2、ps-elf查看第二列中有无Z的进程sar-d530系统性能检测系统日志检查日志中无warning,error,fail,panic等异常提示,没有系统进程重起的提示检查近期系统的coredump文件没有近期的coredump文件存在检查系统中是否存在core文件以及产生时间,并删除。系统中有无core文件存在镜像bootdisk并对操作系统做备份检查操作系统的备份定期对操作系统做备份数据库的备份策略和restore测试向维护人员了解。定期对数据库做备份,并能成功恢复数据介质管理向维护人员了解介质(含光盘和备份介质)管理有专人负责,并妥善保存安装并运行explorer程序。cd/opt/SUNWexplo/bin#./explorer安装并运行explorer程序Explorer能够正常运行并能生成压缩文件。必要时将explorer送到SUN内部站点进行分析检查有无漏掉FCO,FIN等结果信息结果信息操作系统检查说明:进行以下检查时,需要使用root用户来操作。必须谨慎,不得随意执行其他命令。委门户sun服务器巡检报告设备物理检查结果信息结果信息结果信息维护是否规范检测磁盘管理软件检查系统性能检测
本文标题:sun服务器巡检报告
链接地址:https://www.777doc.com/doc-4482428 .html