您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 业务连续性和灾难恢复的具体操作
三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量业务连续性和灾难恢复的具体操作三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量•业务连续性管理理论回顾•业务连续性管理的具体步骤•业务连续性演练方法•Q&AAgenda三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量•日益频繁发生的灾难–自911恐怖袭击、2003年的非典和2004年的印度洋大海啸后,尤其2008年我国发生的四川汶川大地震,使人们更加意识到灾难随时随地都可能发生,直接威胁到公司的正常运营,间接影响到公司的声誉、品牌、信誉,甚至公司的存亡。•业务中断对企业的影响–随着企业的业务对IT的依赖越来越高,IT如何面对灾难对业务造成的巨大损失、面对业务部门不断攀升的服务要求,面对复杂的系统,合理地把工作做在灾难发生之前,主动预防,成为IT管理者必须直面“永续运行”的课题。背景三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量•1风险发生某种威胁使资产损失或破坏的潜在可能•2事故可以或可能导致组织业务中断、损失的突发情况或事件•3灾难灾难是对组织产生灾害性影响的事故,或者大范围影响业务正常运行的事故•4业务中断预先计划的(如员工罢工、飓风)或者是非计划的(黑客入侵或地震)的事件,产生了与组织目标所期望的产品或服务的交付物产生了非计划的、负面的背离结果基本概念三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量5灾难备份灾难备份是指为了减少灾难发生的概率,以及减少灾难发生时或发生后造成的损失而采取的各种防范措施。6灾难恢复灾难恢复是一个在发生计算机系统灾难后,在远离灾难现场的地方重新组织系统运行和恢复营业的过程。灾难恢复的目标是保护数据的完整性,使业务数据损失最少甚至没有业务数据损失。二是快速恢复营业,使业务停顿时间最短甚至不中断业务。基本概念5三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量•911恐怖袭击发生一年后统计,原来世贸大厦中的350家公司,重新开张的只有150家,200家企业由于重要信息系统的破坏,关键数据的丢失而永远的关闭、消失了。•在世贸大厦租有25层的金融界巨头摩根斯坦利公司,事发几个小时后,该公司宣布:全球营业部可以在第二天照常工作。如何应对灾难-覆巢之下,亦有完卵三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量灾难恢复的生命周期三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量业务持续管理是一个整体性的管理流程,它主要识别公司潜在的风险和提供一个建立快速恢复能力和有效反应能力的框架,从而减低灾难给业务带来的冲击以及确保公司关键业务的持续性,它旨在提高组织面对业务中断的复原力,以达到组织的关键目标;Ø当发生中断后,在业务可接受的时间内和服务水平下,提供给组织支持关键产品和服务的恢复能力;Ø交付验证管理业务中断能力,并保护组织的声誉和品牌;业务连续性管理的定义三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量BCM,ITSCM,ITDRP的关系和区别业务连续性管理(BCM)IT服务连续性管理(ITSCM)IT灾难恢复计划(ITDRP)主要目标管理业务风险,确定业务可用性当意外发生时在预先定义的服务水平上交付关键IT服务当发生重大中断后恢复关键IT系统范围业务流程IT服务IT系统职责角色高管CIO,CTOIT运维经理三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量Agenda•业务连续性管理理论回顾•业务连续性管理的具体步骤•业务连续性演练方法介绍•Q&A三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量灾难风险评估(RA)业务影响分析(BIA)恢复技术方案设计DRP开发运营维护风险因素业务关键性分析IT现状分析容灾技术分析恢复时间RTO恢复数据点RPOIT应用恢复策略关键业务方案选择方案设计方案实施响应和决策流程技术恢复步骤测试演练计划灾备组织结构演练培训业务连续性管理管理流程概览三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量•阶段一、风险分析•阶段二、业务影响分析•阶段三、企业容灾环境分析•阶段四、业务连续性策略制订•阶段五、容灾方案设计•阶段六、业务连续性流程设计•阶段七、业务连续性流程及方案管理和测试业务连续性管理的7大步骤三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量•识别支持关键IT服务的资产•评估威胁,或者任何可能导致服务中断的事件•评估自身的弱点•威胁对组织产生的影响•评估风险的可能性阶段一:风险分析Analysis分析Analysis管理AssetsAssets资产ThreatsThreats威胁VulnerabilitiesVulnerabilities弱点Risks风险Countermeasures对策三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量•信息和数据•硬件•软件•服务•文档•人员另外还有一些需要考虑的传统资产包括:建筑物、存货、资金和无形资产等。信息系统资产14三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量信息系统可能受到的威胁分类特性举例自然灾害受害程度高地震,风灾,水灾,火灾等等人为破坏以破坏为主要目的爆炸,恐怖袭击意外故障突发的非人为因素系统故障,程序故障人为失误非故意的失误造成输入数据差错,操作失误侵犯不正当存取,访问黑客侵入,盗取数据三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量风险种类应对策略解释高危低频降低利用政策或措施将风险降低到可接受的水平,如建设异地容灾心高危高频避免避免受未来可能发生事件的影响而消除风险,如HA低危高频转移将风险转移给资金雄厚的独立机构,如系统维护外包低危低频接受维持现有的风险水平,如金融危机风险应对策略三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量对每个关键业务:Ø业务影响分析(BIA):是组织评估和文档化业务活动中断对其所支持的关键产品和服务的影响ØBIA的工作流程确定BIA的目的和范围获取上层重视和资源支持数据收集(调查问卷/面谈)数据分析(定性/定量)汇总BIA结果阶段二:业务影响分析三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量关键业务的影响分析评估关键业务中断后影响确认每个关键业务中断恢复所必须达到的水平确认每个关键业务最大可容忍时限确认任何相关联的资源的可持续性或恢复需求恢复所需要的最少操作恢复到正常水平所需的时间启动中断恢复的最大时间间隔三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量阶段三:企业容灾环境分析三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量Ø人员是技术和流程的制定者和执行者Ø流程是指导、约束人员、操控技术、开展业务的保障Ø技术是实现手段和工具Ø供应商是为客户提供服务的机构业务连续性的重要方面—4P业务连续性计划供应商人员流程技术三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量阶段四:业务连续性策略制订三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量•灾难备份系统一般由可接替生产系统运行的后备运行系统、数据备份系统、终端用户切换到备份系统的备用通讯线路等部分组成。•在正常生产和数据备份状态下,生产系统通过人工或网络传输方法向备份系统传送需备份的各种数据。备份中心与生产中心及终端用户的关系如图所示。23主机生产中心终端用户数据备份场地后备运行系统灾难备份中心人工电子阶段五、容灾方案设计灾难备份系统的组成三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量主机生产中心终端用户数据备份场地后备运行系统灾难备份中心灾难备份系统的组成24•灾难发生后,备份系统将接替生产系统继续运行,备份中心、生产中心及终端用户三者之间的关系如图所示。此时重要营业终端用户将从生产主机切换到备份中心主机,继续对外营业。三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量容灾数据复制主要技术方案比较25容灾分类复制方法主机影响使用环境描述复制模式和数据一致性维护难度RTO/RPO要求主机软件复制操作系统的磁盘镜像10-30%同构主机只支持同步方式,所以建议在10公里范围内使用,比较消耗系统CPU资源同步,可以保证一致性操作简单,但如果容灾中心的存储故障或中间链路故障,将影响到生产系统RTO比较小;RPO接近于0基于逻辑卷的远程复制10-30%异构存储通过IP网络将逻辑卷Log复制到异构主机,在异地主机重演逻辑卷操作I/O过程同步和异步,可以保证一致性一般RTO较短;同步RPO接近0;异步RPO在分钟级存储硬件级复制高端磁盘阵列本身的远程数据拷贝8%同构主机同构存储同构存储通过光纤直连方式可以支持到10公里,是采用较广的容灾方式同步和异步,基本所有存储产品可以保证同步模式的数据一致性维护容易;主备中心之间比较容易切换RTO较短;同步RPO接近0;异步RPO在秒级到分钟级三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量容灾数据复制主要技术方案比较26容灾分类复制方法主机影响使用环境描述复制模式和数据一致性维护难度RTO/RPO要求应用层数据复制应用实现或通过中间件实现10%异构主机异构存储设备投资最节省,但需要调整应用同步或异步,可以保证数据一致性高。应用修改需要按照容灾规范,维护成本高交易级数据库数据复制数据库本身的复制功能10%同构主机异构存储相同数据库异步Log传输,灾难发生时会丢失少量数据,只能保护数据库里的数据,远程数据中心必须配置主机参数与数据拷贝过程异步,可以保证数据一致性维护成本高,主备数据库的结构、参数等需要同步变更,日常维护工作量大丢失Log文件;RTO可以比较短,但从容灾中心回切生产中心工作量大三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量选择容灾方案的五大因素三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量阶段六、业务连续性流程设计三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量业务连续性演练流程三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量•目标和范围•角色和职责•任务和行动列表•资源需求清单•详细的联系人清单•表格和清单业务连续性计划(BCP)内容三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量典型的BCP架构和内容计划内容参考数据(包括合同的细节)活动列表角色和职责阶段恢复正常状态恢复阶段告警阶段恢复正常状态计划恢复正常状态恢复业务流程决定并启动待命状态,进行灾难评估危机管理紧急响应和抢救措拖三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量阶段七、业务连续性流程及方案管理和测试ØBCM演练ØBCM维护ØBCM评审三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量Ø验证:•计划的适用性?•计划的完整性?•预期的时间内(RTO)能够完成恢复任务•员工充分了解•资源充分并安排合理•外部供应商有能力履行合同Ø熟练:•有效决策•减少混乱•缩短恢复时间•降低恢复成本测试和演练的收益三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量BCM的演练过程评价BCP遵循流程记录是否可达到预期演练评价演练协调演练持续改进设计演练演练范围后勤安排状态检查协调人员活动协调各个部门处理意外和变更是否达到目标研究各个部门的情况简洁成功与不足BCP效果Timeline三人行,必有我师ITIL先锋论坛,汇聚IT服务管理大师们的力量•审查和更新BCM的范围,角色和职责•分配和更新合适人或团队负责BCM•通过演练确保BCM的有效性•在组织范围内强化BCM的意识•管理BCM演练过程•定期审查和更新业务持续性能力,包括风险分析和业务影响风险•维护和更新相关文档•监控组织的业务持续性能力并确定变更机制•维护与业务持续性相关的成本投入BCM维护的内容三人行,必有我师ITIL先锋论坛,
本文标题:业务连续性和灾难恢复的具体操作
链接地址:https://www.777doc.com/doc-1637204 .html