您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 招标投标 > 系统运维方案(投标技术文件)
七、运维方案7.1运维服务目标及服务范围通过购买专业运维服务,进一步加强xxx数据中心运行维护,对数据中心运行维护流程提供先进的管理理念与流程,并通过专业的技术支持为数据中心运行维护工作提供专业的技术平台,满足xxx大数据量安全存储的要求,可以满足多种应用运行环境稳定的要求,可以满足系统及数据高效、可靠和安全运行的要求,可以满足运行设备统一管理、及时的故障恢复的要求,可以保证在数据中心构建的应用系统和数据集中运行的设备平台正常运行,满足省本级数据库和应用系统的建设需要,达到高效、稳定、安全和高扩展性的要求,为实现省本级信息化建设的可持续发展奠定集中统一的设施基础。设备及软件清单:序号名称数量质保情况11在保210在保36出保42)51在保62在保71出保82出保91出保101出保112在保126出保134在保14IBMX365015出保15IBMX3850M24出保16IBMX3850M31出保17IBMX32501出保181在保19HUAWEIUSG55002在保20HUAWEIS93122在保2120在保22H3CS51003出保233出保242出保251在保262在保272在保284出保29中间件WEBSphere6.1和7.020出保7.2服务内容依据客户提供的设备及软件清单,我公司对xxxxxx提供如下服务内容:业务系统服务项保证措施办法小型机、pc服务器网络设备、存储系统现场驻点服务5×8小时到达客户现场时间30分钟内电话后响应时间60分钟内备件到达现场时间24小时高级工程师现场支持提供检查设备各部件的状态灯;提供检查并处理设备的错误日志;提供硬件设备的全面检查;提供网络配置的检查及测试;提供操作系统性能分析;提供小型机配置信息,根据需要调整配置;提供设备的微码版本检查;提供存储设备运行情况检查;提供提交详细的预防性维护报告和总结;提供对检查结果综合分析,并形成分析报告;提供每季度全面巡检提供系统运行环境检查:包括机房温度、湿度和零地电压、零火电压等提供机房空调运维设备故障恢复时间48小时内全面巡检次数2次/年坏件更换提供日常清理及更换过滤网和加湿罐等耗材提供定期清理机房空调的室外机;检修机房内各供水管路及排水管路,杜绝漏水,保证管路畅通。提供配备机房专业知识的人员对机房实行5X8小时值班。提供UPS设备运维故障恢复时间72小时内全面巡检,巡检时检查蓄电池使用情况,并且进行充放电;1次/年坏件更换提供配备机房专业知识的人员对机房实行5X8小时值班。提供数据库要求完整、详细、真实的维护记录文档,按月、季、年度提交规范的维护报告。提供维护文档提供日常运行状态监控提供BUG管理提供数据库安装、配置管理提供存储管理提供对数据库进行优化提供按季度进行巡检提供解决数据库运行中出现的各类故障提供文档提交提供中间件规范的维护制度提供维护文档提供日常运行状态监控提供BUG管理提供按季度进行巡检提供安装维护7*24小时解决中间件运行中出现的各类故障立即响应备件保证备件库提供备件更换现场更换技术服务驻点服务:1.提供7×24小时免费故障检测与维修换件现场服务2.预防性维护服务提供远程技术支持服务:1.提供7×24小时的故障响应电话支持2.每周一次与客户沟通交流提供培训服务:1.专业知识培训2.日常运维管理提供远程诊断远程拨入系统分析提供远程故障解决提供远程系统性能监控提供7.3运维人员组织架构7.3.1运维组织结构介绍我公司将在此运维项目中投入业务水平高、技术能力强的运维人员和质量控制人员,采用xxx公司严格规范的运维管理模式,进行全方位管理。为了进一步确保运维项目的进度与质量,xxx公司在项目运维阶段、质量管理、技术文档等方面进行严密规范的部署。xxx公司的运维队伍组成包括:运维项目总负责人(常务总经理兼任);运维管理委员会(项目经理、甲方代表、监理代表);运维驻点服务小组;技术支持专家组;备品备件供应小组;文档管理小组7.3.2运维成员职责项目经理职责:项目经理受公司总经理任命和委托,全权负责运维项目合同的各项条款的履行。对运维项目的优质、高效、安全负全责。驻点工程师职责:1、负责对小型机、服务器、存储设备相关的申报事件进行处理和解决。2、负责对小型机、服务器、存储设备提供日常性能和运行状况监控,对故障进行分析处理及建立完善预警机制。3、负责保障机房服务器正常运行,遵循用户的安全保障管理要求。4、接受用户对服务器维护事件的督办、检查,协助服务台完成对用户意见进行回访和事件统计、分析。对服务过程和反馈的意见进行改进,同时接受服务台的绩效考评工作。5、及时提供服务器运行和问题处理情况,并向用户负责,并按周、月、季、年提交运维运维服务工作进度总结和计划。6、负责整理和归纳服务器日常维护知识库,提交至运维服务平台。7、负责整理和提交服务器运维过程资料和相关配套维护文档。技术支持专家职责:1.为客户提供7×24小时的故障响应电话支持。2.接听客户服务热线电话和接收(电话/Email/Fax等)客户服务请求;3.通过网络或电话为客户提供即时的远程技术支持,包括软硬件故障的诊断和排除,客户端软件的安装和设置。4.协调多方服务团队,及时跟进未完成的服务请求并及时更新系统信息和状态;备品备件管理员职责:1.组织实施备品备件的订购、运输及入库工作2.负责汇总待料备件,及时采购或调拨,并主动向项目经理说明待料原因、追踪处理。7.3.3运维成员组织结构针对本次维保项目我公司配备了5名专职人员具体如下表:序号分派职位数量(人)姓名获得证书1项目经理1项目管理师资格证2驻点工程师13技术支持专家1OCP证书IBM认证证书4备件管理员15文档管理员1备注:人员证书附下页:7.4运维质量保证措施7.4.1质量控制管理按照相应的ISO9001:2000国际质量体系标准及国家规定进行质量控制,还以相应的规范要求对设计质量,施工质量、材料和设备质量进行管理、要求、控制。公司的施工阶段性内部验收制度,是质量控制管理的有利保证。工程的每一个阶段完成时,公司技术支持部门都要按有关部门规范和要求进行严格的内部验收。验收标准整体上高于用户验收标准。7.4.2进度控制管理针对本次项目我公司结合客户要求做出如下运维计划:序号名称人员周期1小型机、存储系统巡检报告驻点工程师/技术支持专家每周2pc服务器驻点工程师每周3网络设备驻点工程师/技术支持专家每周4机房空调巡检报告驻点工程师每周5UPS巡检报告驻点工程师每季6数据库系统运维驻点工程师/技术支持专家每周7中间件系统运维驻点工程师/技术支持专家每周8问题报告驻点工程师/技术支持专家问题解决后9月总结报告驻点工程师每月10季度总结报告驻点工程师/技术支持专家每季度11年总结报告驻点工程师/技术支持专家/项目经理每半年12定期培训技术支持专家每季度具体输出见本投标文件7.6具体服务项目及输出文档7.5运维流程及服务方式7.5.1服务方式针对本次项目我公司为保证各系统的稳定可靠的运行我公司根据该项目的具体要求提供三种方式的技术支持服务,分别为:现场服务、远程技术支持服务、针对甲方运维人员的技术培训服务。现场服务对客户的系统进行现场维护和巡检,驻点工程师对各个应用系统完成定期巡检,同时输出巡检报告提交给客户,驻点工程是还应对客户的故障设备进行维修和更换备件服务。为了让客户得到更及时和更快的服务,驻点工程师还提供7×24小时的故障响应电话支持。远程技术支持服务远程技术服务主要是通过电话或其他方式受理客户和驻点工程师的疑难问题,通过沟通来指导客户或驻点工程师解决问题,同时远程技术服务工程师还通过电话或者其他方式与客户主动沟通来提高客户管理和运维能力。技术培训服务为提高客户的运维人员的技术水平及运维管理能力,我公司将派遣具有丰富实施经验的技术专家定期对客户进行相关专业(主机、存储、数通、网络、安全、机房环境等)的培训。培训可以采用灵活多样的方式如面对面交流、课堂授课、邮件沟通等。7.5.2运维流程我公司除培训服务外,为本项目提供两种服务方式:一种为技术人员现场值守,另一种是定期巡检结合故障现场服务。1、技术人员现场值守运行维护服务的基本操作流程如下图所示:日常巡检是否存在问题巡检报告NO输出定位问题YES可现场排除更换备件问题解决NOYES问题报告输出运维文件归档归档运维资源建档更新资源配置2、定期巡检结合故障现场运行维护服务的基本操作流程如下图所示:IT资源汇总技术专家识别问题备件管理员备件更换问题报告故障解决输出运维资源建档用户驻点工程师IT资源更新告知客户7.6具体服务项目及输出文档7.6.1小型机、pc服务器、网络设备及存储系统小型机、pc服务器、网络设备及存储系统运维部分主要分为三部分,分别为小型机存储系统运维、pc服务器运维、网络设备运维。小机存储系统运维内容主要包含小型机设备、光纤交换机、存储设备三部分主要从以下几个方面进行维护:1、检查设备各部件的状态灯;2、检查并处理设备的错误日志;3、硬件设备的全面检查;4、网络配置的检查及测试;5、操作系统性能分析;6、核对各小型机配置信息,根据需要调整配置;7、检查设备的微码版本;8、检查存储设备运行情况;针对如上要求输出如下检测报告:小型机系统巡检报告用户单位名称:设备名:设备型号:产品序列号:检测项目检测方式说明检查结果巡检周期电源风扇检查主电源灯状态指示灯常绿表示系统正在运行正常□异常□检查直流电源指示灯状态指示灯常绿表示电源供电正常正常□异常□检查直流电源风扇状态检查风扇是否散热正常□异常□处理器执行命令:lsdev–Ccprocessor检查CPU的数量及状态。CPU状态为Available,表示CPU使用正常正常□异常□内存执行命令:lsattr–Elmem0检查内存数量及状态。size与goodsize的数量相等表示内存使用正常正常□异常□磁盘执行命令:lsdev–Ccdisk检查磁盘的数量及状态。磁盘状态为Available,表示磁盘使用正常正常□异常□适配器执行命令:lsdev–Ccadapter检查系统中配置了哪些适配器及使用状态。各个适配器的状态为Available,表示各个适配器目前工作正常。若适配器状态为Define,则表示该设备已经被配置但是未被当前系统使用。正常□异常□分页空间执行命令:lsps-a检查分页空间的分配数量及利用率。Size为已分配的分页空间数量;%Used为目前系统的分页空间使用率,该值若超过70%,正常□异常□表示系统内存不足系统镜像执行命令:lsvg–lrootvg检查系统卷组的镜像状态。各个逻辑卷的PPs数量应该为LPs数量的整数倍,倍数大于1并且能被PVs整除,表示卷组已经作镜像。各个逻辑卷的LVSTATE应该为syncd,否则表示镜像不同步。正常□异常□文件系统执行命令:df-k检查已经挂载的文件系统的使用状态。重点检查/(根)/tmp(临时)/var(日志文件)这些动态文件系统的使用率最好保持在70%以下。正常□异常□错误日志执行命令:errpt检查系统日志是否有硬件或软件方面的永久错误。若发现错误类型为P的信息,则需要注意。正常□异常□网卡配置情况执行命令:ifconfig–a检查各个网卡的配置情况,状态是否为UP,检查ip地址和子网掩码等配置是否正确。正常□异常□系统备份执行命令:lsmksysb-V-f/dev/rmt0检查磁带备份的可读性。若没有错误显示,则表示备份磁带的数据是有效可恢复的。正常□异常□客户确认巡检结论:【】合格【】不合格用户代表签字:年月日服务工程师签字:年月日存储系统设备巡检:设备名称:检查时间:年月日时本年度第次检查检查项目:检查结果:1.检查存储硬件情况:设备故障灯是否有亮SAN交换机端口LED状态□有□无□正常□不正常2.存储系统故障报告(ProblemLog):□正常□不正常ProblemLog/ServiceableEvent□正常□不正常有否硬件故障3.存储系统运行状态:ViewStorageFacilityState/□正常□不正常CdaPreverify/V
本文标题:系统运维方案(投标技术文件)
链接地址:https://www.777doc.com/doc-7227234 .html