您好,欢迎访问三七文档
第1页运维体系建设介绍及公司运维现状与展望第2页目录运维部门的价值与挑战运维部门的工作内容运维工作体系建设之流程与制度(Process)运维工作体系建设之人员(People)运维工作体系建设之技术(Technology)运维工作的现状与展望第3页运维部门的定位运维部门在公司的位置图例:对热线服务提供疑难技术支持,提升品牌形象,对产品优化研究,提升产品质量服务中心热线RMA技术支持中心备件中心Tec中心实验室平台为最终用户提供安全、可靠的支付等服务丰台菜市口CMNET望京亦庄根据产品方案,定制集成的系统方案,并保证按照规范平稳的运行系统各业务线前端的产品和研发人员设计和生产软件模块第4页运维部门的价值“以流程为导向,以客户为中心,以技术为支点,提供低成本、高质量的IT服务,以满足业务快速发展的需要”全面管控企业范围内基础设施、信息资产等资源,实现前端业务的快速上线;售后用户的投诉等问题实现第一时间、一次性的完善解决,提升内外部客户的满意度业务快速响应要求业务连续性要求业务安全性要求成本预测与量化要求对在线业务从系统层到业务层实现全面的监控,从被动处理转变为主动预防,制定SLA考核指标,提升故障的快速定位和解决,保障业务达到超出竞争对手的稳定运行率运维服务实现标准流程化管理,统一计费单元,对服务进行计费管理,服务价值与业务发展相符。采用先进的技术,低成本对应业务转型,技术创造价值横向从人员、流程、制度、技术手段等方面,纵向从网络层、主机层、存储层、数据层、业务层等方面,形成网状结构全面梳理安全问题,保障业务的机密、完整和可用性第5页运维部门的价值运维部门在公司的地位和作用大背景:产品的前期设计和开发在整个生命周期中只占20%左右,80%时间集中在运维和运营工作,随着各行各业的大规模信息化建设时代接近尾声,IT运维时代已经来临。不同的公司,公司不同的发展阶段,运维部门地位和作用不同:“管理要效益”Consumerlead“规范期”Normative梦网业务的“蛮荒期”Startuptime业务拓展为重,业务量考核,满足接入上量为原则SP为中心缓解管理压力为重,重点解决系统稳定性、产品可用性、投诉处理运营、运维管理为中心效益考核为重,业务品牌建设,个性化服务细节,产品质量提升用户为中心移动梦网发展三个阶段运维部门频繁上线及排障,多采用人海战术,规范性较差,“被动、无序”,产品的可用性及安全问题突显。运维部门承担了产品质量的评价和部分管理职能,规范流程制度,向技术运维转型,致力于消除人为事故和安全隐患运维部门从系统整体性角度出发,牵头持续优化产品质量和性能。用户满意度成为考核指标第6页•网络和产品缺乏可用性等指标评价体系,系统优化缺乏依据;•运维人员在运维流程中缺乏服务评价指标体系,从而不能作为绩效考核的依据;•生产环境中单点设备较多,业务中断风险高;•老旧设备对新技术支持较差,资源分配不灵活;•监控、拨测等自动化运维工具缺乏,工作效率差、人力成本高;•CMDB缺乏,生产环境中“僵尸节点”较多,影响业务更新,甚至带来平台重构的风险;•运维部门处于生产和销售的中间环节,对前后端各条业务线提供多种服务,规范的流程缺失,导致解决问题靠英雄和人情,责任定位不明确;•各种特批流程泛滥,运维人员的工作处于无序化,紧急且重要的业务需求得不到优先支持,影响内外部客户的满意度;•运维部门规模较小,人员紧张,分工粗泛,要求一人多能,一人管理多条业务线,导致人员专业性不强,人员数量和技能与实际要求差距较大,业务需求得不到快速良好的支持;•运维人员的职业规划和能力培养尚不完善,不规律的作息和巨大工作压力,导致了运维人员大量流失,工作分工不明确,经验固化随之薄弱。运维部门的挑战运维部门的困境和挑战指标绩效基础设施流程制度运维人员①②③④第7页目录运维部门的价值与挑战运维部门的工作内容运维工作体系建设之流程与制度(Process)运维工作体系建设之人员(People)运维工作体系建设之技术(Technology)运维工作的现状与展望第8页运维部门的工作内容概念介绍—系统分层:业务层数据层存储层主机层网络层DB层*DB层的运维目前不在网络与系统运行部第9页运维部门的工作内容工作内容的分类配置梳理配置间关系梳理日常巡检全面监控售前方案系统调优投诉处理备份灾备问题排查故障处理上线割接商户接入业务推广活动支撑业务数据提取告警处理容量分析与报告安全扫描安全加固安全工具更新安全策略制定配置管理变更管理事件管理问题管理容量管理持续性管理可用性管理业务支撑安全管理123456789101112131415161718192021应急演练第10页运维部门的工作内容运维工作部署演进•运维工作多而杂,通过把复杂的运维工作从项目、系统分层、业务线进行三个维度的切分,使工作内容职责清晰,更易于落地执行;•对细分的工作内容进行梳理,固化工作经验,形成专业的操作手册,对于可以自动化实现的部分,做成运维工具,达到降本增效的目的,降低人为操作的误差;•将细分的专业化的工作模块化,由一线运维团队、二线支撑团队,和临时的虚拟项目组承担,或者考虑成本的要求,在安全性要求较低的工作上购买外包服务网络系统模块操作系统模块数据库及应用模块售后投诉模块第11页目录运维部门的价值与挑战运维部门的工作内容运维工作体系建设之流程与制度(Process)运维工作体系建设之人员(People)运维工作体系建设之技术(Technology)运维工作的现状与展望第12页运维工作体系建设之流程制度流程制度分类部门内部的流程制度部门与外部的流程制度①部门内各团队间的工作流程一线、二线团队之间的工作流程;虚拟团队的工作流程;服务产品外包的工作流程;②部门内的操作规范、安全制度银联的安全规范、制度移动的安全规范、制度公司的安全基线规范③运维相关的编码的安全规范①售前技术支撑流程②上线流程③投诉处理流程④事件管理流程⑤问题管理流程⑥敏感数据提取流程⑦业务推广活动支撑流程⑧商户接入流程第13页运维工作体系建设之流程制度流程制度举例北京移动安全管理实施细则V5为了防止客户信息泄露等事故再次发生,重铸公司的品牌和信誉,北京移动公司网络部牵头,历时1年,各个部门均有参与,参与编写人员近百名,完成了公司内部的安全管理实施细则,共35个分类,全面梳理了公司内部各重要的流程中人因因素的部分,制定了操作和审计制度。系统的安全制度体系方面我们公司比较缺失第14页运维工作体系建设之流程制度部门间服务接口--服务目录概念:服务目录是管理内外部客户期望,使服务产品化、提升服务交付质量的重要工具服务的内容和范围服务运行的前提条件服务的水平要求服务的沟通界面服务的评价方法1售前技术支撑2上线服务3投诉处理服务4事件处理通报5问题处理6数据提取服务7业务推广支撑……我们会按照和各业务线梳理和签订的服务目录,制定人力资源计划和各团队及各人的KPI服务项目服务内容第15页运维工作体系建设之流程制度服务目录举例—上线服务服务的内容和范围服务运行的前提条件服务的水平要求服务的沟通界面服务的评价方法1售前技术支撑2上线服务按次分配,内容和范围写在上线工单中:1、网络需求2、应用需求3、主机需求1、上线前提交资料2、大型上线需要有评审会1、不影响已有业务功能2、新上线功能正常使用3、在业务规定时间内上线1、OA工单流程(两个铁律)2、电话、邮件3、会议已做成上线打分表,对前端的上线的完备性做评价……服务项目服务内容第16页目录运维部门的价值与挑战运维部门的工作内容运维工作体系建设之流程与制度(Process)运维工作体系建设之人员(People)运维工作体系建设之技术(Technology)运维工作的现状与展望第17页运维工作体系建设之人员研发团队和运维团队的关系举例:A组B组项目1A组研发B组运维……项目2B组研发A组运维保守期运维人员由研发人员轮岗X产品生命周期例一:NEC研发组运维组项目1研发组运维组……项目2研发组运维组保守期研发组留人运维组留人X产品生命周期例二:华为、联想、腾讯等产品部维护部项目产品部门向维护部门交维……保守期维护部门X产品生命周期例一:北京移动……运维部门研发组1研发组2例四:联动优势第18页运维工作体系建设之人员运维团队内的架构举例产品1一线运维团队产品2产品n二线应用运维团队一线运维团队一线运维团队二线网络运维团队二线主机运维团队二线数据库运维团队安全团队北京移动:一线运维组:购买各产品原厂的维保;二线应用运维组:系统负责人A、B角;二线的网络、主机、数据库运维组购买神码的专业团队支撑所有产品;安全组:移动员工专业团队运营商、银行、证劵公司多采用腾讯公司:一线运维组:按各产品划分二线的应用运维组:支撑产品组合;二线的网络、主机、数据库组:按照机房物理地点划分安全组:管理所有产品互联网公司多采用研发团队第19页运维工作体系建设之人员根据公司的运维人员来源,人员架构如下:商户组运行组主机组网络组维护组技术支撑组一线团队二线团队技术支撑团队负责商户接入商户接入前的技术支撑;接入中的调试;接入后的问题解决负责生产系统的一线运维全面监控生产环境;告警、投诉和故障的及时响应;一线问题梳理;协助二线对系统优化负责应用深度运维各业务线一名专员在产品、研发阶段随工;产品设计阶段规划系统方案;做成维护手册前移至一线团队;各业务的系统排障;处理复杂投诉;负责系统质量指标制定和系统优化工作负责自动化工具研发与新技术研究研发监控、部署、商户调试等自动化运维工具;业界先进的运维技术研究并立项负责网络、主机的深度运维制定主机、网络方案,维护及优化生产环境物理设备,响应一线团队的告警、排障需求。第20页运维工作体系建设之人员运维人员的发展路径以成本低、适应面广、服务优为视角,形成规模化的综合能力优势,锻造一支准确定位、快速反应的一线运维技术服务团队一线运维专才1以技术精、业务通为视角,锻造专家型技术支援团队,形成对各业务线的核心把控能力,向IBM800技术热线或思科CASE团队水平靠拢,彰显公司技术售后服务品牌形象TAC专家2系统技术架构师3以灵活可靠,扩展性强为视角,形成各业务线的软件、硬件集成架构体系,具备主机、网络、DB及应用的综合技术能力,以及全方位的安全保障的能力技术体系规划师4以技术前瞻为视角,形成清晰的技术体系规划蓝图,确保基础架构以最优的方案满足供公司的业务需求,技术战略与时俱进,保持行业领先水平,具有核心技术优势和竞争力第21页目录运维部门的价值与挑战运维部门的工作内容运维工作体系建设之流程与制度(Process)运维工作体系建设之人员(People)运维工作体系建设之技术(Technology)运维工作的现状与展望第22页运维工作体系建设之技术业务支撑能力建设IaaS平台架示意构图IaaS:基础设施即服务,主要是将网络、服务器等基础设施和操作系统、数据库等基础软件看作资源,对这些资源进行虚拟化,以CPU、内存、存储容量、操作系统等为单位向用户提供应用软件运行环境的服务模式。IAAS平台可提供的网络资源、计算资源、存储能力等构建成资源池,随时随需进行分配和调度;底层硬件设施的采购不会受制于应用的制约;对于业务增减变化频繁的的情况,不仅可灵活弹性的分配资源,还可及时对下线业务占用的资源进行回收再利用,实现投资保护并减少系统建设成本;通过资源的分配量,可计量每个业务所占用的系统成本,并使服务可度量,为公司预算管理提供依据;对于公司移动金融云的战略,IaaS也是基础。第23页运维工作体系建设之技术运营支撑能力建设北京移动企业信息门户内部信息门户:企业内部信息门户是一个基于Web的系统,它是企业内部员工与团队之间互动、信息和知识共享的门户:信息门户可为员工提供一个统一入口,只需单点登录,即可处理各类工作和流程,快捷获取所需信息可为整个企业的信息发布和集成提供统一的渠道。实现统一的用户认证、授权和安全管理。企业内部的员工之间是有分工的,不同员工由于角色不同、层级不同,因而不同的员工具有不同的工作,内部信息门户为每位员工提供独特
本文标题:运维体系建设介绍.
链接地址:https://www.777doc.com/doc-2000183 .html