您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 网站策划/UE > 政府门户网站维护项目运维方案
XXXXXXX政府门户网站维护项目运维方案XXX公司2017年5月目录第一章运维方案1.1运维总体原则1.1.1整体性原则我们将综合考虑XXX目前所有门户网站相关应用系统的现状,提出整体的运行维护策略,有效保障系统运行中各环节的不间断运行,并综合使用不同层次的技术手段,为应用系统和系统依托的基础环境提供全方位的监控管理和服务。1.1.2有效性原则将充分利用各种现代技术手段,选择一款功能丰富、技术先进的系统运维监控软件,结合科学合理的运行管理机制,对系统的稳定可靠运行提供有效的保障。1.1.3可靠性原则对维护工作中后续应用系统模块的开发设计中,应采用成熟可靠的技术和产品,同时配合完善的项目控制规范和质量保证体系,保证互联网站的升级维护中的严格的质量控制,保证系统开发和运行的安全可靠。1.1.4反馈性原则实现运维中发现、需要解决的问题要及时反馈给信息系统的开发商进行完善,利于优化机构、岗位设置,利于业务流程的改进。1.1.5防范预警原则运维系统中应包含各种预案,争取实现在故障、问题出现时有章可循,在紧急状态有应急措施,提高运维效率,将故障代价减小到最小。1.2运维服务目标按照网站管理处要求,完成与XXX网站运维相关的日常工作。1.3项目运维服务方案1.3.1运维服务总则1.3.1.1安全性(1)XXX门户网站及内容管理平台应用的安全性确保网站能够正常访问;确保网站群动态应用正常,并能够提供正常的服务。(2)XXX门户网站及内容管理平台数据的安全性确保数据库中的信息跟网站发布的信息一致;确保数据库数据正确,不被非法破坏,并且及时做数据库和网站数据的备份,当意外发生时,网站能够及时、完全恢复;未经许可,不得将网站数据泄漏给其它个人或组织;由专人负责,保证数据的安全。1.3.1.2稳定性(1)不间断服务提供7*24不间断服务,专人值守,监控网站;意外情况下,及时通知信息中心相关负责人,并做好各项应急准备。定期向信息中心相关负责人汇报网站运营情况。(2)访问响应时间监控网站群访问速度,如访问相应时间过长,及时查找原因,并向信息中心相关负责人汇报;监控网站群动态应用,对影响应用性能方面因素及时预警,并提出相应解决方案,及时汇报给信息中心相关负责人。1.3.2运维服务计划为了对此次维护服务项目提供良好的管理监控,并对项目中各管理组织之间的持续运作建立恰当联系,我们把整个项目执行分为三个阶段:1、启动阶段项目前期的准备工作,包括服务管理制度流程的建立、人员的到位,运维体系中各种因素的交接。我方将在签订合同后的5个工作日内,提供详细的项目实施工作计划(包括:项目组成员、运维服务的内容、进度安排、应急预案等)。2、正常服务阶段正常的执行资产管理和运营维护。3、收尾阶段项目的总结移交并达到有序的结束。1.3.2.1启动阶段和运维体系的导入在此阶段中,主要执行前期的准备工作,为尽快向客户提供高质量的服务打好基础。该阶段主要工作如下:1、成立维护服务项目组,确定客户与XXX公司的职责分配2、相关人员提前到位,提供维护服务的准备工作3、召开项目启动会议,明确工作范围,制定启动阶段计划4、项目管理、运营维护等规章制度流程的确定5、服务工具的安装、运维体系管理文件的草拟6、与客户方人员一起讨论有关的工作计划和需求7、系统维护服务实施方案的出台和审核8、原来的服务商对XXX公司的知识、档案转移,XXX公司进行签收,确保服务的无缝链接9、对客户的系统信息进行摸底大调查,建立和更新配置管理数据库10、对现有系统进行分析,得出改进报告,提交用户1.3.2.2正常服务阶段项目启动后,新的运维服务体系可以实现完成所有设备维护后,即进入正常的服务阶段。在正常服务阶段,所有的工作将按照制定的计划进行,并提供服务级别的承诺。具体的工作如下:1、服务管理体系和流程的改进2、正常的维护管理3、风险评估1.3.2.3收尾阶段此阶段开始于合同结束前1个月(如合同继续延期续签,则本阶段工作主要以总结为主)。这个阶段的主要工作是和客户充分沟通,移交服务期的工作,争取继续合作的可能。并从此项目的服务实施过程中积极总结经验,以促进提高在未来的项目中的工作绩效。1、收集服务期中各部分的服务文档资料。2、汇总、装订,提交用户并存档。3、项目评估、总结。4、向甲方或甲方指定的其他组织进行档案和知识转移,人员培训,确保系统的稳定运行。1.3.3运维服务体系1.3.3.1IT服务体系的建立XXX公司作为国内积极参与政府信息化建设的大型企业之一,长期以来积累了丰富的技术支持和运维服务经验,始终视服务为企业生存与发展的生命线,优秀的服务理念成为我们在激烈市场竞争中所体现的鲜明特色。1.3.3.1.1IT服务体系整体结构只有高效、稳定、个性化的本地化服务模式才能满足用户随时随地的服务需求;也只有迅速的维护响应才能真正保证用户的利益不受损害。因此我们在自身服务体系的基础上,针对XXX政府门户网站内容管理平台运维项目,特定IT服务体系,由响应体系、维护体系和质量监督体系构成,见下图所示:图1:IT服务体系架构1、客户需求在服务协议规定范围内的任何服务请求,包括咨询、问题申报、投诉等。2、响应体系第一时间受理客户的需求,以最快的速度解决问题,保障客户系统尽快恢复正常。3、维护体系对客户系统进行主动式服务,发现并解决系统隐患,优化系统性能,并提出合理的改进和升级建议。4、质量监督体系为保障服务的质量制定相关的服务协议,通过满意度调查等方式评估服务的提供是否正常。IT服务体系最终都可以通过本次项目建设的ITIL运维体系落实,响应体系对应ITIL运维体系的“事件管理”,维护体系对应ITIL运维体系的“问题管理”,质量监督体系则通过“运维管理”来实现。1.3.3.1.2响应体系响应体系包含服务台和突发事件管理,主要任务是受理客户的服务需求,尽快恢复客户系统的正常运行。客户有问题可以通过热线电话、Email与服务台联系,服务台负责接听技术服务电话、受理客户问题,进行记录,分类并转给相应的工程师处理。二线工程师负责处理服务台分配的事件或问题,当二线工程师需要技术支持时,可以从公司总部获第三方获得到技术支持和实验室环境支持。故障级别服务请求时间响应方式、时间一级故障7×24服务台接到服务请求后,即刻响应,服务人员工作时间内马上到达现场,非工作时间1小时内到达,进行现场服务。二级故障7×24服务台接到服务请求后,对于电话未解决故障,15分钟内再次回应,提供电话技术支持,工作时间内服务人员1小时到达现场。三级故障7×24服务台接到服务请求后,30分钟内再次回应,提供电话技术支持,工作时间内服务人员2小时到达现场,或与用户协商1.3.3.1.3质量监督体系为保障向客户提供的服务准时高效,质量监督体系是必须的。运维团队和客户将按照合同的要求,共同制定服务协议书中的各项服务水平要求,以监督保障所提供的服务质量。质量监督体系的主要工具是满意度调查,衡量的标准即双方认可的服务水平要求。满意度调查制度及时了解客户对我们事件处理情况的重要手段。也是我们不断改进、完善服务的渠道。服务满意度调查制度同响应体系事件的调查制度一样,技术服务中心将协同客户一起定期对提供的服务进行全面的满意度调查,以此来提高服务的质量。满意度调查结果与服务工程师的当期绩效考核挂钩,作为工程师个人业绩评价的参考数据之一。1.3.3.2IT运维体系的建立ITIL提供了一个概念化、模块化的优秀框架,与其说是解决方案,不如说它更象理论。它提出了建立IT服务管理体系时要考虑哪些流程,提到了应该做哪些,好处在哪儿,但并不详细介绍怎样去做,因此它本身不具备实际操作可能性。我们在长期的运维项目中积累的丰富的经验,根据XXX门户网站的实际情况,对ITIL进行适当选取、适应和扩展:(1)导入ITIL是一个长期过程,运维运维初期,以“系统日常运行和支持”为主,重点解决服务支持(ServiceSupport)流程,对发生的问题进行维护和处理。在运维后期,运维的服务支持流程步入正轨后,再关注运维服务的长期计划和改进,考虑服务提供(ServiceDelivery)。(2)针对XXX门户网站,运维的主要任务是解决发生的问题,对IT基础架构进行基本的配置管理,因此主要实现“服务台”、“事件管理”、“问题管理”和“配置管理”,至于变更管理在实际运维中,暂时没有系统工具支持,放在后期在规范流程,并用信息系统化实现。(3)由于初期运维工作内容多,系统繁杂,人员少,为提高运维人员解决问题的能力和效率,运维体系扩展加设“知识库”,以提高运维技术的积累、传承、利用。经过对ITIL体系进行适当选取、适应和扩展,从适合XXX门户网站,适合运维团队完成任务目标为主,我们制定了个性化的运维体系,如下图所示:图2:IT运维体系架构个性化的XXX门户网站运维体系设置“服务台”统一接受各种故障受理,包括最终用户直接电话或邮件传来的求助信息和运维监控软件过来的自动报警信息,然后服务台问题分析并归类,力求初步解决用户或系统的故障;不能在线解决的需求问题,启动“事件管理”和“问题管理”流程,运维人员按照既定的流程,在“知识库”和“配置管理”的支持下,解决故障,并把积累的经验知识归入知识库。问题解决后,运维体系反馈于IT系统,促使其更好更稳定运行,并促进其优化和完善。其中,“知识库”和“配置管理”可以依托运维监控工具实现信息化作业,而“服务台”、“事件管理”和“问题管理”则仍然依照对应的制度人工操作,暂时没有信息化系统辅助运行,可以考虑在后期建设运维平台时优先实现。所有的事件都应该基于影响度、紧急度和优先级进行分类分级,并提供相应的解决方案和临时方案。表1:系统运维故障级别定义故障级别服务请求时间响应方式、时间一级故障7×24服务台接到服务请求后,即刻响应,服务人员工作时间内马上到达现场,非工作时间1小时内到达,进行现场服务。二级故障7×24服务台接到服务请求后,对于电话未解决故障,15分钟内再次回应,提供电话技术支持,工作时间内服务人员1小时到达现场。三级故障7×24服务台接到服务请求后,30分钟内再次回应,提供电话技术支持,工作时间内服务人员2小时到达现场,或与用户协商注:故障级别描述:一级故障是指系统发生严重故障,业务发生中断,或虽然业务未中断但已经无法保证及时、正确的情况,对用户业务的运行有严重影响。二级故障是指对于系统发生的非严重故障,业务并未中断,业务仍然及时、正确的情况,但性能有所下降。三级故障是指系统发生轻微的故障,系统有警告信息等,对系统没有较大影响的故障。1.3.3.3系统运维制度建设在信息化运维中,制度建设是一道必要的保障。信息化不能一蹴而就,在信息化发展到一定阶段,建设重点应该要从系统实施转向以应用运维提升为主,运维质量保障、安全机制变得重要起来,这时除了技术的保障以外,制度保障越显得重要。对于IT运维团队来说,可从以下几个方面来进行IT运维制度化:(一)转变运维观念,树立规范化意识。树立只有建立制度化的IT运维意识,才能在日常繁杂琐碎的工作中有效的区分任务的优先级,将有限的资源投入到最能满足“客户”需要的工作中。为保证运维工作,把运维工作和制度化紧紧地捆绑到一起。运维工作很琐碎,关键在于规范而不是创新。只有各级运维技术人员一丝不苟、老老实实按规范做,才能够把事情做好。(二)建立事件处理流程,强化规范执行力度。首先需要建立故障和事件处理流程,利用表格工具等记录故障及其处理情况,以建立运维日志,并定期回顾从中辨识和发现问题的线索和根源。建立每种事件的规范化处理指南,减少运维操作的随意性,在很大程度上降低故障发生的概率。同时,建立IT运维制度非常重要,但是有了制度还要有人去执行,要强化执行制度比建立制度更重要的观念和意识。1.3.3.4运维管理机制建设“三分建设,七分管理”,XXX公司采用多重管理制度,并加强沟通机制,力求完善建设ITSM中的服务监督体系。1.3.3.4.1升级管理机制升级管理是突发事件管理的重要组成部分。“事件跟踪”将记录从受理用户问题到派单过程中相关人员所做的处理和建议,保证信息的
本文标题:政府门户网站维护项目运维方案
链接地址:https://www.777doc.com/doc-7109529 .html