您好,欢迎访问三七文档
1Let’smakeyourbusinesssmooth上海企顺信息系统有限公司2020年3月灾难恢复从技术到管理张杰2Let’smakeyourbusinesssmooth内容•灾难恢复管理概述–概念、背景、价值、……•灾难恢复技术概览–高可用性、备份、复制、远程集群–持续数据保护、其他关键技术……•灾难恢复实施概述–管理体系要素–项目实施过程3Let’smakeyourbusinesssmooth一、灾难恢复管理概述•灾难恢复–“将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态的活动和流程”。——《重要信息系统灾难恢复指南》,2005年4月,国信办。•灾难恢复管理–利用技术、管理手段以及相关资源,确保已有的关键数据和关键业务在灾难发生后在确定的时间内可以恢复和继续运营的过程,是一项集技术和管理于一体的系统工程。4Let’smakeyourbusinesssmooth高度依赖•业务系统对信息技术的依赖性越来越强–无论是政府部门、企业还是个人–信息系统停机往往导致业务中断–信息数据已成为企业的生命源泉•同时,信息系统的复杂性带来更大的脆弱性–越来越多的漏洞5Let’smakeyourbusinesssmooth风险变大•调查显示–20%的企业平均每五年就会遇到影响公司运营的意外情况•越来越多的威胁–自然风险:地震、火灾、水灾、气象、疾病、战争、……–人为风险:错误操作、黑客攻击、病毒发作、员工恶做、……–技术风险:设备失效,软件错误,通讯中断、电力失效、……•最近事件–美国911事件、中国“非典”疫情、印度洋海啸、……–莫斯科大停电、伦敦地铁爆炸、……6Let’smakeyourbusinesssmooth后果严重•美国明尼苏达大学:如果在发生灾难后的两个星期内,无法恢复公司的业务系统,75%的公司业务将会完全停顿,43%的公司将再也无法开业•IDC统计:美国在2000年以前的十年间发生过灾难的公司中,有55%当时倒闭,剩下的45%中,因为数据丢失,有29%也在两年之内倒闭,生存下来的仅占16%。•GartnerGroup:在经历大型灾难而导致系统停运的公司中有2/5再也没有恢复运营,剩下的公司中也有1/3在两年内破产。•……业务每小时停机损失证券经济类645万美元信用卡销售授权260万美元航班预售9万美元ATM服务1.5万美元…………突发事件造成的行业服务损失情况数据来源:StrategicResearchCorporation7Let’smakeyourbusinesssmooth最后防线•传统信息安全技术无法抵御大的风险和威胁–例如地震、洪水、战争等等•传统信息安全技术对付传统风险具有局限性–病毒、黑客攻击等造成的业务中断时间可能过长,导致需要切换•保险无法保证企业的生存–无法找回用户数据。尽管可以挽回部分损失———————————————————————————————•信息安全概念也在不断发展–COMSEC(保密,通信保密)–INFOSEC(保护,保密性/完整性/可用性)–IA(保障,PTO*PDRR*)–……8Let’smakeyourbusinesssmooth实施价值•减少风险损失–2000年2月7日美国8大知名网站瘫痪损失12亿美元–ebay:1999年6月12日:22小时故障,损失:$3M-5M+26%股票市值损失–AT&T:1998年4月13日:6-26小时故障,损失:$40M用于折扣•确保持续发展–9.11生存启示(1200/400/6%)•满足商业需要–服务于全球客户的复杂性,以及消费者的高期望值–据介绍是否引入有效的BCM机制,已经成为一些发达国家政府机构与企业选择合作伙伴或供应商的一个必要条件———————————————————————————————•已经成为现代企业的管理战略之一•Meta预测:在全球大公司中用于灾难恢复管理的投入从4%上升到7%9Let’smakeyourbusinesssmooth灾难恢复-未来法规遵从的要求•法规遵从——法律的高度的要求–2004年,国际“法规遵从年”•国际,超过16000部法规–沙宾法案Sarbanes-OxleyAct、全美证券交易商协会行为规定(NASD3110)–美国健康保险便利和责任法案(HIPAA)、联邦条例21CFR第11部分–FDA、NYSE、AMEX、FERC、……•国内–《国家信息化领导小组关于加强信息安全保障工作的意见》(中办发[2003]27号)–《关于做好重要信息系统灾难备份工作通知》(信安通[2004]11号)–《重要信息系统灾难恢复指南》(2005.5.26广东南海)–……10Let’smakeyourbusinesssmooth二、灾难恢复技术概览–高可用性技术–数据备份技术–数据复制技术–远程集群技术–持续数据保护技术–其他关键技术11Let’smakeyourbusinesssmooth系统停机原因及防护技术•时间点复制•备份•数据仓库•远程备份•远程复制•系统热备•高可用性技术•磁带备份•数据复制•时间点复制人为过失32%计算机病毒7%硬件或系统故障44%站点灾难3%软件故障14%•时间点复制•备份12Let’smakeyourbusinesssmooth灾难恢复技术思路-3R•冗余性(Redundancy)–灾难恢复实现的基础•可恢复性(Recoverability)–确保冗余的内容能在灾难发生后可以使用•远程性(Remoteness)–确保能够抵御灾难的影响13Let’smakeyourbusinesssmooth高可用性技术•设备冗余技术•路径冗余技术•系统冗余技术•技术特点:–减少停机时间–保护内容全面–本地的保护措施–基础容灾技术–切换是关键SANFabric14Let’smakeyourbusinesssmooth数据备份技术•Host-Based备份架构•LAN-Based备份架构•LAN-Free备份架构•Server-Less备份架构•Zero-impact备份架构•相关技术–数据恢复–备份策略–虚拟磁带库–压缩技术–……•技术特点–数据剥离-离线–可以抵御逻辑错误•抵御大灾难需要–远程备份或传输•适合业务–对数据丢失不敏感–对应用停机不敏感•其他容灾技术的基础LANNTUNIX存储区域网15Let’smakeyourbusinesssmooth数据复制技术•基于存储子系统数据复制•基于存储网络层数据复制•基于卷管理器数据复制•基于应用数据复制•技术特点–数据在线状态–需要配合时间点技术抵御逻辑错误•抵御大灾难需要–远程数据传输•适合业务–数据很重要•远程应用集群基础16Let’smakeyourbusinesssmooth远程集群技术•主要技术架构–1+1或N+1–OS-Based或Application-Based•全冗余架构实现集群–冗余服务器、冗余应用、冗余信号传输路径、冗余数据访问路径、……•切换是关键–应用切换–数据切换–访问地址切换保护应用的运行状态17Let’smakeyourbusinesssmooth持续数据保护技术•“持续数据保护是一套方法,它可以捕获或跟踪数据的变化,并将其在生产数据之外独立存放,以确保数据可以恢复到过去的任意时间点。持续数据保护系统可以基于块、文件或应用实现,可以为恢复对象提供足够细的恢复粒度,实现几乎无限多的恢复时间点”——SNIA-DMF-CDP(SIG)★数据丢失量少★抵御逻辑错误★更容易恢复★备份窗口小★主机影响小18Let’smakeyourbusinesssmoothDR技术比较保护方式数据丢失量(RPO)系统恢复时间(RTO)高可用性减少停机时间本地、需要配合其他技术实现灾难恢复备份/恢复离线数据周→天→小时周→天→小时复制/恢复在线数据分钟→秒天→小时全局集群在线数据和系统分钟→秒小时→分钟→秒持续数据保护在线数据分钟→秒小时→分钟→秒19Let’smakeyourbusinesssmooth三、灾难恢复实施概述•管理体系•建设过程•最佳实践•相关标准ProcessPeopleProductPlan需求分析确定策略编制计划测试部署维护更新项目启动实施建设管理体系建设过程20Let’smakeyourbusinesssmooth灾难恢复管理体系模型ProcessPeopleProductPlan21Let’smakeyourbusinesssmooth管理体系要素-流程(Process)•日常维护和预警•应急响应、评估与声明•业务紧急接续、过渡期处理•重新安置及启动•……——————————————————————•按照规范和最佳实践:–预防灾难,降低风险发生的概率–高效行动,降低灾难造成的损失22Let’smakeyourbusinesssmooth管理体系要素-团队(People)•领导组•业务恢复操作组•技术功能操作组•外部协调和联系人员•设备和软件供应商联系人•外部协作机构•……————————————————————————————•人是流程的执行主体和关键因素•合理架构、职责、人选、后备、培训、管理23Let’smakeyourbusinesssmooth管理体系要素-设施和技术(Product)•设备–包括能够保证数据恢复和业务运行的信息系统基础设施–主机、存储、网络、卡车、打印机、……•场地–指挥、发布、系统、办公、……–冷场地/温场地/热场地/移动场地/商业场地/……•技术和方案–高可用性技术–数据备份与恢复技术–数据复制和迁移技术–远程集群技术–其他关键技术—————————————————————————————技术决策要素:RTO、RPO、保护距离、TCC、保护对象、……24Let’smakeyourbusinesssmooth管理体系要素-计划(Plan)(例)目标和范围组织和职责联络与通讯紧急响应流程恢复及重续运行流程灾后重建和回退保障条件附录简明扼要25Let’smakeyourbusinesssmooth灾难恢复建设建设过程模型风险分析和BIA确定策略编制计划测试部署维护更新项目启动实施建设26Let’smakeyourbusinesssmooth实践考虑时间$$$t0业务成效解决方案成本t1$1t1=恢复时间目标(RTO)27Let’smakeyourbusinesssmooth实践考虑自建灾难恢复中心:模式1:本地站点生产,远程站点开发和测试模式2:在远程站点进行磁带备份,无需运送磁带模式3:在各站点间平衡应用负荷模式4:在远程站点设置数据仓库并提供决策支持等等……服务外包专业规划、能力维护、测试演练、……28Let’smakeyourbusinesssmooth15分钟1-4小时4-8小时8-12小时12-16小时24小时好几天恢复需要的时间(RTO)费用专门的远程灾备中心Tier7-接近零或是零数据丢失,远程数据镜像,并且业务环境可进行高自动化的业务接管。Tier6-接近零或是零数据丢失,远程数据镜像保证数据的完整性和一致性。Tier5-软件级的,两地点-两阶段提交(交易完整性)。Tier4-批量/在线的数据库镜像或日志的传输,或重复的时间点拷贝。Tier3-电子链接传输。Tier2-PTAM卡车运送+热备份站点。Tier1-PTAM开车运送访问可用的备份中心时间点备份29Let’smakeyourbusinesssmooth《重要信息系统灾难恢复指南》用户灾难恢复系统组成数据备份系统灾难恢复预案备用网络系统备用数据处理系统备用基础设施技术支持能力运行维护管理能力30Let’smakeyourbusinesssmooth谢谢企顺国际技术服务部张杰zhangjie@bizsmooth.com
本文标题:数据备份和灾难管理
链接地址:https://www.777doc.com/doc-4605266 .html