您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 20光大银行IT服务管理的实践与总结
IT服务管理的实践与总结光大银行IT服务管理建设的回顾与发展内容提要背景介绍IT建设背景、ITSM项目背景、运行资源背景初步建设项目启动、项目实施、收益与问题持续完善工具挖潜、流程落实、人员转变、制度配套当前状态ITSM基础、人员专业分工、流程的细化、ITSM成本问题背景介绍IT建设背景、ITSM项目背景、运行资源背景背景介绍IT生产系统背景2000年-4套,开始集中建设2005年-35套初步形成规模,带来运行管理压力2008年-150套ITSM建设的急迫性ITSM项目背景2003年开始登记整理故障记录等2004年开始ITSM理论接触2005年6月启动(一次故障启动)运行资源背景2005年前操作员、系统管理员,被动式管理2006年开始,人员细分,主动式管理(投产审批及标准)初步建设项目启动、项目实施、收益与问题IT系统的快速发展与变化初期目标:IT运行信息控制(CMDB):以运行维护为导向,配置内容:服务器、网络端口、操作信息、文档、帐户、备份介质、监控体系…..;完备监控体系的建设:统筹考虑监控工具、人员、制度及流程,充分利用监控环节的各类信息;事件处理的初步控制:对事件进行分类、登记、跟踪,并做事后分析与评估,促进优化监控、系统管理等工作(无细化的处理流程);变更的管理:对各类变更事件首先以CMDB为核心进行评估与控制,为后续阶段的质量管理等奠定基础;操作环节的控制:对56套生产系统的每日300个操作任务进行自动化控制与调度;按需建设:按照当时的需要,只针对配置、事件、控制与监控进行建设,解决当前矛盾;ITIL的其它部分在初期不加以实施,但做总体考虑(如:SLA);实施的计划要充分考虑各类成本以及自身资源(如:人员的内部培养、外部聘用、专业服务购买)IT系统的快速发展与变化简洁实用对于各类流程根据实际情况先简单实现,不按照ITIL模型照搬;(如:事故处理流程,人员矩阵式配置)人员角色采取有重点逐步过渡的方式;(如:一线监控人员)各类制度是推动ITSM建设的关键,保证制度具有可操作性,具备:人员角色、职责、流程、考核等关键要素;(如:作业调度使用管理规定)责任到人、考虑与待遇配合,有专人负责流程并提出修改意见;(如:运行主管、交接班管理)持续演变事件、变更与配置等是一个循序渐进的过程,分阶段由简单到复杂;(一期项目做,二期可能还需要做)人员、制度、流程与工具都要根据情况不断调整;(如:监控的四个流程{自检、调整、判断、分析}及一个报告{重点、隐患、解决})IT服务管理建设的初步目标-日常运维有效管理日常运维管理的核心内容企业IT基础部件主机等硬件存储设备各类系统软件各类应用软件各类通讯线路各类文档流程各类配置参数日常运维有效管理的目标保障IT系统的稳定与效率从容应对各类紧急事件合理的IT系统架构设计流程控制•工作流程控制•操作流程控制全面的监控体系•IT基础环境监控•应用系统检查•系统性能管理•总体运行情况分析CMDB、事件、配置、变更CMDB配置管理从项目开始的理想设计到实际应用的逐渐过度CMDB初期的理想化CMDB的实用化•以系统运行为主导、考虑IT审计等需要;•每类CI都要考虑相关的责任人;•CI之间的关系更重要;•每类CI都对应一定的流程CMDB的实用化既是软件的架构也是监控信息监控体系的建设系统监控在运行管理中的功能运行管理架构的建设建立IT运行的预警机制:提高故障主动发现的比率建立系统的评估机制:基于数据对系统性能、容量评估建立IT运行质量控制机制:问题的预先解决、质量把关是IT服务管理体系的基础奠定数据基础:真实的运行数据奠定控制基础:事故发现、定位、处理的基础奠定知识基础:监控消息的“消化”,形成知识库(专业服务)奠定人员基础:监控环节不仅仅是一类人员的工作奠定流程基础:是各类流程的起点,也是监视环节Page14监控在ITSM中的功能以OVO为基础的监控工具体系OVO服务器LOGLOGIC对SYSLOG日志的搜集过滤、报警SNMP转发OVO的各类AGENT各类设备的SNMP应用自定义的服务检查流程ECC、ISEE加密机专用设备各类报警消息故障工单OVSD:1.控制故障解决;2.控制监控部署;3.控制监控策略;4.控制故障判断;质量控制安装配置标准测试的标准检查的标准控制的标准OVSD与OVO的配合(日常工作流程)与IT服务管理中其他功能的关系与事故处理的关系对于事故的发现与定位,主要依靠监控体系,同时对于没有在监控体系发现与定位的事故,必须认真评估,查找原因后不断修补监控体系,提高OVSD中故障主动发现的比例;与变更管理的关系在变更过程中必须考虑监控和检查手段;在发现监控体系漏洞后必须通过变更环节协调CMDB中CI修改;与配置管理的关系在配置管理数据库(CMDB)建立应用系统监控信息,针对任何投产的应用系统,能够明确其构成结构及对应监控手段,建立完整的应用架构档案(可考虑SN的展现);与系统开发的关系在应用开发阶段,逐步按照《应用系统投产文档建立规范》完善架构设计、容灾、容错、性能等环节,并最终产生移交文档;(质量控制)将移交文档在监控、配置管理等环节实施;监控系统有效运行流程_(新系统投产)《开发人员》建立应用可用检查清单按照:1)IT基础环境;2)应用可用检查;两个项目形成投产监控档案在OVO中部署各节点及层面的监控模板,设置特定阀值实施应用可用的:1)特定检查;2)服务检查;《系统管理员》建立应用IT基础环境检查清单《监控管理员》依照以往经验建立应用可用基础检查清单1)通过OVSD变更流程登记;2)变更OVSD问题库协调一线监控人员;3)统一报警到OVO平台;《一线监控人员》监控OVO对:1)IT基础环境严重报警;2)应用可用严重报警;发起事故工单协调责任人处理按授权启动应急流程监控系统有效运行流程_(持续维护)OVO监控平台《一线监控人员》监控OVO对:1)IT基础环境严重报警;2)应用可用严重报警;发起事故工单协调责任人处理按授权启动应急流程OVSD平台《开发人员》建立应用可用检查清单《系统管理员》建立应用IT基础环境检查清单《监控管理员》依照以往经验建立应用可用基础检查清单按管理规定监控并发起报警用户投诉检查:1)所有事故来源为监控体系的有效性;2)未被监控体系发现的事故,确认监控检查方式;事故管理ITSM建设初期目标_事故处理事故的分类,由值班人员统一跟踪ITSM建设初期目标_事故处理事故来源的详细定义,统计分析的基础ITSM建设初期目标_事故处理提高故障主动发现的比率变更管理ITSM建设初期目标_变更管理CMDB是变更的基础,变更与监控协调一致ITSM建设初期目标_操作的控制操作的变更首先在CMDB实现ITSM建设初期目标_操作的控制作业调度的实现ITSM建设初期目标_操作的控制作业执行情况的监控IT服务管理建设的收获与问题流程控制、全面监控、主动管理人员转化、流程制度、工具支持IT服务管理建设的收获_初期建设思路理论产生的背景IT系统故障的危害巨大;有效维护IT系统超出了纯粹的技术范畴;基于技术的复杂管理体系;理论的意义总体描述了管理的范畴,细化各个环节;科学的划分了各个管理控制层次;利用理论指导的思路首先:统计分析企业自身各类IT事故、事件,找出最近、威胁最大的问题;其次:分析企业已有的IT参与人员、制度及流程;再次:参照企业对IT部门的责权利定义;最后:制定IT服务管理的基础建设方案;IT服务管理建设的收获主动式系统管理通过变更等流程控制CMDB进而控制IT架构的关键环节;根据OVSD的事件、变更管理,控制IT服务质量;根据系统的变更,及时定义修改对应的各类流程;依照各类控制流程、IT架构设计策略,逐步完善应用系统设计规范,保证系统的效率与安全全面监控体系完善配置OVO等IT基础环境监控工具,首先保障IT基础环境健康,做到及时排除事故隐患;积极利用各类系统优化工具及专业分析排除故障隐患制定标准,设计应用检查规范充分搜集整理以上三个渠道的系统运行数据,为系统管理环节提供系统设计规范素材完善的流程控制根据系统管理环节的定义,在iEAI实现所有操作流程的控制,对操作的执行过程保留完整的执行现场数据;实现项目流程的管理,保证投入运行系统的质量;在OVSD实现ITSM的工作流程控制(人员角色间配合)过渡到完善的IT服务管理架构是一个渐变的过程,借鉴理论,结合实际,在IT系统日常运营管理工作中,首先努力做好以下三个方面的工作,为后续ITSM建设打下坚实的基础IT服务管理建设的收获-主动系统管理涵盖范围应用系统日常变更、配置、事故处理策略与流程;应用系统各类检查与应急处理流程;应用系统的持续优化;应用系统规范的细化以及与开发环节的衔接;针对系统运行的各类统计分析报表;参与人员角色划分运行主管、监控管理员、系统管理员、变更管理员、项目开发人员关键问题能够控制各类CI之间的关联关系;能否有效的实施各类流程及管理制度;主要职责保证日常变更的完整与准确(与监控,处理流程的关系)依据运行中的各类事件和要求,调整应用系统规范,做到预先控制控制对关键配置信息的更改与维护IT服务管理建设的收获-主动系统管理数据库主机、服务器存储文档组织人员厂商服务网络应用操作流程CMDB纳入范围、专人管理帐户IT服务管理建设的收获-主动系统管理通过分析抓住重点,消除故障根源IT服务管理建设的收获-全面的监控体系涵盖范围生产系统的IT标准组件监控(OS/DB/MW/硬件/网络);关键应用进程及其日志,应用与外部的关联,应用特定配置、特殊设备;应用批作业的特定监控(批处理状态检查等);参与人员角色划分监控人员、运行主管、监控管理员、系统管理员、变更管理员、应用开发人员监控的不同部分监控广泛概念的IT标准工业组件(IT基础环境监控);可灵活自定义系统主动检查流程(特定应用监控);深入分析与优化能力(性能分析);主要职责通过监控体系主动发现事故,通过分析报告发掘隐患;通过{自检、调整、判断、分析}四个流程保证监控系统的不断自我完善;通过监控系统的积累,逐步建立知识库;IT服务管理建设的收获-全面的监控体系全面监控体系的概况应用前端应用服务进程、专用设备存储操作系统中间件数据库主机网络应用外部连接专业诊断工具及性能管理OVOIT组件标准监控主动检查流程应用维护流程(批作业等)此部分主要监控构成应用系统的标准IT组件,针对标准的协议、资源、服务、日志等进行监控,考虑各应用系统的不同特点,定义不同的监控模板,被动大范围的监控各类事件发生,同时搜集系统运行性能数据,这类故障约占系统故障的30-40%此部分主要是针对应用系统的特定配置、维护操作、应用的关联、专用设备等进行监控,是一个灵活修改、主动检查的体系,主动发现应用系统故障的60-70%IT服务管理建设的收获-人员的流程化事件发生:多渠道一线登记:分类,发起呼叫,跟踪二线解决:系统管理员总负责,首先定位问题,其次解决三线支持:项目组,系统工程师,厂商监控/问题:确认监控漏洞、修订标准IT服务管理建设存在的问题-人员转化人员分工的细化与流程整体的协调;ITSM人员角色与目前IT部门人员所属部门的协调;人员角色的责权利与企业人力资源部门的协调;各层次人员的持续培训问题;发挥各层面人员主动性的问题;IT服务管理建设存在的问题-流程制度流程修改的成本控制;流程与管理制度的配套;流程制定过程中各层面人员的参与;流程的实现问题(没有好的控制手段就难以深化、落实);流程与部门分工的协调;IT服务管理建设存在的问题-工具支持对CMDB的修改的有效控制(变更的可操作性);对CMDB的展现问题(在评估中发挥作用);对CMDB中数据的报表展现(无法利用CMDB数据生成各类管理报表);IT服务管理持续建设流程驱动、范围扩展、标准建设质量管理、全面考虑、框架
本文标题:20光大银行IT服务管理的实践与总结
链接地址:https://www.777doc.com/doc-3903511 .html