您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > VMware虚拟化平台巡检手册
VMware云平台巡检手册2系统拓扑图第一章系统拓扑图11.1物理连接图..........................................................................................................................11.2整体拓扑图..........................................................................................................................11.3拓扑结构说明......................................................................................................................2第二章物理硬件检查报告32.1172.16.12.75硬件状态报告............................................................................................32.2172.16.12.76硬件状态报告.............................................................................................5第三章虚拟平台检查报告83.1虚拟平台基本状态检查......................................................................................................83.2虚拟平台安全检查报告....................................................................................................153.3系统性能检查报告............................................................................................................173.4系统告警检查报告............................................................................................................21目录CONTENTS第一章1第一章系统拓扑图1.1物理连接图1.2整体拓扑图2系统拓扑图1.3拓扑结构说明由上图可以看到,物理层面,我们用户采用了两台IBMX3850X5的X86服务器作为虚拟化的物理服务器。用1台IBMDS5020作为虚拟化存储,同时该存储中划分了众多LUN,部分LUN用于别的系统使用(如小型机系统)。存储和主机之间通过SAN交换机连接。整个虚拟化服务器通过LAN网络对外提供服务。在虚拟层面,我们用户虚拟化采用HA机制来保护虚拟机的高可用。第二章3第二章物理硬件检查报告2.1172.16.12.75硬件状态报告2.1.1CPU状态报告在虚拟平台上,所有物理硬件都被视为物理资源,在虚拟平台上CPU的状态参考值必须为Normal,表示处于正常状态。在用户vmware虚拟平台上,这台IP地址为172.16.12.75的IBMX3850,物理CPU型号为IntelXeonE7-48202.00GHz;目前状态正常。4物理硬件检查报告2.1.2内存状态报告内存状态参考值也必须是Normal,从上图我们看到用户这台IP地址为172.16.12.75的IBMX3850配置了32G内存,存在告警,告警内存的状态无法识别。建议检查停机检查内存。第二章52.1.3其他硬件状态报告由上图可以看到,其他硬件状态全部处于Normal状态。属于正常状态。2.2172.16.12.76硬件状态报告2.2.1CPU状态报告在虚拟平台上,所有物理硬件都被视为物理资源,在虚拟平台上CPU的状态参考值6物理硬件检查报告必须为Normal,表示处于正常状态。在用户vmware虚拟平台上,这台IP地址为172.16.12.76的IBMX3850,物理CPU型号为IntelXeonE7-48202.00GHz;目前状态正常。2.2.2内存状态报告内存状态参考值也必须是Normal,从上图我们看到用户这台IP地址为172.16.12.75的IBMX3850配置了64G内存,状态正常。第二章72.2.3其他硬件状态报告由上图可以看到,其他硬件状态全部处于Normal状态。属于正常状态。8虚拟平台检查报告第三章虚拟平台检查报告3.1虚拟平台基本状态检查3.1.1172.16.12.75基本状态检查3.1.1.1网络状态检查报告第三章9在虚拟平台上,网络基本建议必须有冗余设计,不存在单点故障。同时根据虚拟化平台高可用性的特性,我们设计规划中,对于网络必须拥有多张网卡,建议每台主机有8张千兆网卡为佳。对于虚拟交换机,如果无特殊业务需求,建议每台ESXI主机仅有一个标准虚拟交换机或者分布式交换机。从上面两图来看,我们用户虚拟平台首先管理网络存在单点故障,没有冗余。同时我们当前有3台虚拟交换机,这3台虚拟交换机,实际情况只有vswitch0挂载有虚拟机,其他2台,没有挂载虚拟交换机。Vswitch1预计是做链接NAS存储用,vswitch2配置了管理地址,做管理用。对于vmotion,FT等高可用的网络确没有做任何配置。这种配置模式不合理。所有网络都处于单点故障状态,对于虚拟平台的高可用也存在严重问题。建议修正配置。3.1.1.2存储状态检查报告10虚拟平台检查报告在虚拟平台上,存储基本建议必须有冗余设计,不存在单点故障。同时根据虚拟化平台性能的要求,我们设计规划中,对于存储规划上,我们要求存储的LUN划分要合理,使得运行性能最佳。从上图来看,我们用户虚拟平台存储存在两个存储,1个为性能较高的SAN存储。另外一个为性能较低的NAS存储。然而这两个存储属于各自运行,性能相差较大,无法进行冗余设计。建议配置一台同样性能SAN存储,作为冗余。NAS存储仍然作为备份使用。同时对存储里面的LUN进行重新划分,以优化性能。由于用户虚拟平台配置了SSD存储。SSD存储可以作为主机缓存。这里主机缓存配置把所有SSD盘当作主机缓存。建议重新配置,按照实际情况配置。3.1.1.3虚拟机状态检查报告虚拟机良好运行状态,应该保障无告警,无性能问题,有高可用保障。由上图我们可以看到,用户虚拟化平台上的虚拟机已经处于HA群集状态,但同时有很多VM处于告警状态,该告警,经过初步分析,有可能以下原因引起:第三章11VMtools异常引起;GuestOS异常引起;目前存在内存错误引起;软件授权异常引起某些模块无法正常工作引起;我们建议,首先消除底层的内存错误,然后检查GuestOS和VMtools工作情况,其次对vmwarevsphere升级到最新的5.1。3.1.2172.16.12.76基本状态检查3.1.2.1网络状态检查报告12虚拟平台检查报告在虚拟平台上,网络基本建议必须有冗余设计,不存在单点故障。同时根据虚拟化平台高可用性的特性,我们设计规划中,对于网络必须拥有多张网卡,建议每台主机有8张千兆网卡为佳。对于虚拟交换机,如果无特殊业务需求,建议每台ESXI主机仅有一个标准虚拟交换机或者分布式交换机。从上面两图来看,我们用户虚拟平台首先管理网络存在单点故障,没有冗余。同时我们当前有3台虚拟交换机,这3台虚拟交换机,实际情况只有vswitch0挂载有虚拟机,其他2台,没有挂载虚拟交换机。Vswitch1预计是做链接NAS存储用,vswitch2配置了管理地址,做管理用。对于vmotion,FT等高可用的网络确没有做任何配置。这种配置模式不合理。所有网络都处于单点故障状态,对于虚拟平台的高可用也存在严重问题。建议修正配置。3.1.2.2存储状态检查报告第三章13在虚拟平台上,存储基本建议必须有冗余设计,不存在单点故障。同时根据虚拟化平台性能的要求,我们设计规划中,对于存储规划上,我们要求存储的LUN划分要合理,使得运行性能最佳。从上图来看,我们用户虚拟平台存储存在两个存储,1个为性能较高的SAN存储。另外一个为性能较低的NAS存储。然而这两个存储属于各自运行,性能相差较大,无法进行冗余设计。建议配置一台同样性能SAN存储,作为冗余。NAS存储仍然作为备份使用。同时对存储里面的LUN进行重新划分,以优化性能。由于用户虚拟平台配置了SSD存储。SSD存储可以作为主机缓存。这里主机缓存配置把所有SSD盘当作主机缓存。建议重新配置,按照实际情况配置。3.1.2.3虚拟机状态检查报告虚拟机良好运行状态,应该保障无告警,无性能问题,有高可用保障。由上图我们可以看到,用户虚拟化平台上的虚拟机已经处于HA群集状态,但同时有很多VM处于告警状态,该告警,经过初步分析,有可能以下原因引起:VMtools异常引起;GuestOS异常引起;14虚拟平台检查报告目前存在内存错误引起;软件授权异常引起某些模块无法正常工作引起;我们建议,首先消除底层的内存错误,然后检查GuestOS和VMtools工作情况,其次对vmwarevsphere升级到最新的5.1。3.1.3系统授权检查报告由上图可以看到,我们用户的虚拟平台输入的license为vsphereenterpriseplus5.0的license。经过了解得知,我们用户目前购买的为4.x版本的vsphere。上第三章15述的使用方式适用于测试使用。正式生产平台建议购买vsphere5.1最新版本license。由于之前已经购买过4.x版本,可以选择升级或者新购。3.2虚拟平台安全检查报告3.2.1172.16.12.75安全检查报告安全配置的参考准则:没有必要开的服务必须关闭,只是偶尔需要通讯的,我们可以通过防火墙限制。防火墙默认只开需要对外提供服务的端口。由上图可以看到,我们的安全配置属于正常状态。没有开放多余的服务和端口。16虚拟平台检查报告3.2.2172.16.12.76安全检查报告安全配置的参考准则:没有必要开的服务必须关闭,只是偶尔需要通讯的,我们可以通过防火墙限制。防火墙默认只开需要对外提供服务的端口。由上图可以看到,我们的安全配置属于正常状态。没有开放多余的服务和端口。第三章173.3系统性能检查报告3.3.1172.16.12.75性能检查报告3.3.1.1CPU性能报告CPU性能参考值:其中1%~30%属于比较空闲,31%~80%属于资源合理利用。80%~99%属于繁忙;(这里数值不包含HA切换需要预留的资源,如果HA切换需要预留资源则应该扣除)我们用户虚拟平台开启了HA,HA至少需要保留25%的资源;那么只要CPU保持在55%以下都是正常范围。由上图可以看到,我们的月平均CPU使用率才2.5%;属于比较空闲状态。3.3.1.2内存性能报告内存性能参考值:1%~30%属于资源富余状态,31%~90%属于资源合理利用;90%~99%属于资源繁忙;(这里数值不包含HA切换需要预留的资源,如果HA切换需要预留资源则应该扣除)我们用户虚拟平台开启了HA,HA至少需要保留25%的资源;那么只要内存使用率保18虚拟平台检查报告持在65%以下都是正常范围。由上图可以看到,我们的月平均内存使用率才62.5%;属于比较空闲,接近繁忙状态;这里需要特别注意的是,虚拟化平台的内存管理的气球技术统计无数据。这和软件授权和底层内存状态识别有关系。需要及时修正。3.3.1.3磁盘性能报告磁盘性能参考值:空间方面80%以下为可用,81%以上为空间不足;I/O方面,占总I/O性能的70%以下为优良状态。
本文标题:VMware虚拟化平台巡检手册
链接地址:https://www.777doc.com/doc-7485762 .html