您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > IT服务管理之事故管理
IT服务管理之事故管理1IT服务管理(ITSM)1.1定义ITSM是一套通过服务级别协议来保证IT服务质量的协同流程,它融合了系统管理、网络管理、系统开发管理等管理活动以及变更管理、资产管理、问题管理等许多流程的理论和实践。1.2基本原理ITSM的基本原理可简单地用“二次转换”来概括,第一次是“梳理”,第二次是“打包”,首先,将纵向的各种技术管理工作进行“梳理”,形成典型的流程,将这些流程按需“打包”成特定的IT服务,然后提供给客户。2IT基础架构库(ITIL)2.1定义ITIL是InformationTechnologyInfrastructureLibrary的缩写,被认为是“事实上的IT服务管理标准”。ITIL是一套描述基础架构管理最佳实践的书籍,ITIL是OGC的注册商标。ITIL是一个框架,框架中的模块描述了目标、通用的行为、流程的输入和输出。2.2核心模块服务管理就是ITIL的核心模块。服务管理的十个核心流程分为服务提供和服务支持两组。其中服务提供由服务级别管理、IT服务财务管理、IT服务持续性管理、可用性管理和能力管理5个服务管理流程组成;服务支持由事故管理、问题管理、配置管理、变更管理和发布管理5个流程及服务台职能组成。3从ITIL的服务管理拓展到事故管理a)ITIL的主要流程——服务管理b)服务管理的一部分——服务支持(日常操作)c)服务支持的一部分——事故管理d)服务台和知识库的联系点之一——事故管理e)事故管理的重点——事件匹配f)事故管理所处层面——运维层面4事故管理4.1定义事故管理负责记录、归类和安排专家处理事故并监督整个处理过程直至事故得到解决和终止。事故管理的目的是在尽可能最小地影响客户和用户业务的情况下使IT系统恢复到服务级别协议所定义的服务级别。它强调IT管理部门能以最快的速度处理紧急事故。4.2举例某个用户急需打印一份页数较多的文件,但恰好此时打印机出现故障,传统的处理方式是通知和等待IT部门修复打印机,而ITSM事故管理处理方式是快速解决这个问题,至于是通过修复或是更换一台打印机,则非用户关心的事情。学校当前主要采用传统的IT事故处理方式,用户一般无法在最短的时间内恢复服务,这势必会影响教学或者教务的正常运作。另外当多个事故同时发生时,情况紧急、影响较大的事故可能得不到优先处理。IT事故管理服务理念的引入会更好地支持用户解决事故恢复服务。所有用户只需将事故报告给服务台,事故管理人员根据服务台提供的信息,对每个事故进行分类编号,并在必要时修改事故的影响度和优先级,以确保事故得到快速解决,快速恢复正常运作。4.3目标最快恢复正常服务尽量减少对业务的不利影响确保最可能的服务级别的质量,维护SLA条款的有效性4.4流程a)事故登录(建议通过帮助台)单一编号、登录类型、用户信息、事件描述b)优先分离服务级别、优先编码、业务影响、升级信息c)解决事故二线支持、技术专家、升级管理、文档记录d)解决完毕(建议通过帮助台)通知用户、沟通确认、分类代码、更新记录4.5生命周期4.6分类Impact+Urgency=Prioritya)优先级影响度(Impact)根据影响业务行为的程度威胁了服务级别紧急度(Urgency)根据被影响业务的最终期限根据资源设定优先级人力钱时间b)类别将事件分成不同的组和类,比如:Application、Hardware、ServiceRequest、Security等。4.7建立事故管理流程的好处1)减小突发事件对业务的影响。2)最优化资源进行事件支持,合理分工。3)服务分轻重缓急,保障系统有效运行。4)加强管理层的有形监控和及时反馈。5)及时有效的沟通,提升用户满意度。6)建立知识库,进行知识积累。7)提供管理信息和决策支持依据。4.8对事故管理的看法有很多企业的IT支持部门会因为企业内部层出不穷的技术故障而疲于奔命,这种状况降低了IT支持部门工作的技术含量。不仅如此,人手的短缺和时间的紧迫也一直困扰着这个部门。那么,IT支持部门有可以依靠的省力法则吗?答案是肯定的。在ITIL中,事故管理作为一个核心流程而存在,是解放IT支持部门最有效的法则。事故是指任何不符合标准操作且已经引起或可能引起服务中断和服务质量下降的事件。事故管理的目的就是在出现事故的时候,能够尽可能快地恢复服务的正常运作,避免业务中断,以确保最佳的服务可用性级别。可以说,事故管理流程为那些干着“体力活”的IT部门提供了一整套省时省力的方法。一般来说,当出现事故时,首先是服务台记录与事故有关的客户和用户的信息,如姓名、工作地点和联系电话等,而有关事故信息的详细记录是由事故处理小组完成的。但事故处理小组在记录相关信息和确认事故后,接下来要做的并不是立即解决事故,而应该是先对事故进行初步归类,然后再进行初步处理。在对事故进行归类后,如果没有成功地将事故与问题或先前知名错误进行匹配,下一步就是确定事故的优先级,确保支持小组给予事故必要注意。当IT服务提供方必须同时处理数个事故,但受时间、资源和人力等的限制无法实现时,就要排定处理的先后次序。优先级一般由服务台综合考虑用户和服务级别协议的要求及其它因素后确定的。当一线支持人员在规定的时间内不能解决或没有解决某个事故时,就需将这个事故的处理任务交给更有经验的支持人员。恰当和有效的事故升级机制对事故的成功处理至关重要,同时也对服务支持能力的有效提高相当关键。如果升级太迟或者升级层次不够,就有可能导致IT服务延迟,不能满足服务级别的要求。另一方面,如果升级过快或过度,又可能导致服务支持资源的浪费。总体来说,对客户和用户一是减少了事故对业务的影响,提高了效率;二是化被动为主动,改进了业务系统;三是获得更多有用的管理信息,加强了管理。而对IT部门而言,既提高了绩效评价的准确性、有关服务质量的信息的质量,又提高了服务人员的工作效率、避免了误将某些情形当成事故,最终提高了客户满意度。
本文标题:IT服务管理之事故管理
链接地址:https://www.777doc.com/doc-2880053 .html