您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 清华-威视数据安全研究所
清华大学信息技术研究院清华-威视数据安全研究所2019年10月灾难恢复从技术到管理侯海波清华-威视数据安全研究所内容灾难恢复管理概述概念、背景、价值、……灾难恢复技术概览高可用性、备份、复制、远程集群持续数据保护、其他关键技术……灾难恢复实施概述管理体系要素项目实施过程清华-威视数据安全研究所一、灾难恢复管理概述灾难恢复“将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态的活动和流程”。——《重要信息系统灾难恢复指南》,2005年4月,国信办灾难恢复管理利用技术、管理手段以及相关资源,确保已有的关键数据和关键业务在灾难发生后在确定的时间内可以恢复和继续运营的过程,是一项集技术和管理于一体的系统工程。清华-威视数据安全研究所高度依赖业务系统对信息技术的依赖性越来越强无论是政府部门、企业还是个人信息系统停机往往导致业务中断信息数据已成为企业的生命源泉同时,信息系统的复杂性带来更大的脆弱性越来越多的漏洞清华-威视数据安全研究所风险变大调查显示20%的企业平均每五年就会遇到影响公司运营的意外情况越来越多的威胁自然风险:地震、火灾、水灾、气象、疾病、战争、……人为风险:错误操作、黑客攻击、病毒发作、员工恶做、……技术风险:设备失效,软件错误,通讯中断、电力失效、……最近事件美国911事件、中国“非典”疫情、印度洋海啸、……莫斯科大停电、伦敦地铁爆炸、……清华-威视数据安全研究所后果严重美国明尼苏达大学:如果在发生灾难后的两个星期内,无法恢复公司的业务系统,75%的公司业务将会完全停顿,43%的公司将再也无法开业IDC统计:美国在2000年以前的十年间发生过灾难的公司中,有55%当时倒闭,剩下的45%中,因为数据丢失,有29%也在两年之内倒闭,生存下来的仅占16%。GartnerGroup:在经历大型灾难而导致系统停运的公司中有2/5再也没有恢复运营,剩下的公司中也有1/3在两年内破产。……业务每小时停机损失证券经济类645万美元信用卡销售授权260万美元航班预售9万美元ATM服务1.5万美元…………突发事件造成的行业服务损失情况数据来源:StrategicResearchCorporation清华-威视数据安全研究所最后防线传统信息安全技术无法抵御大的风险和威胁例如地震、洪水、战争等等传统信息安全技术对付传统风险具有局限性病毒、黑客攻击等造成的业务中断时间可能过长,导致需要切换保险无法保证企业的生存无法找回用户数据。尽管可以挽回部分损失———————————————————————————————信息安全概念也在不断发展COMSEC(保密,通信保密)INFOSEC(保护,保密性/完整性/可用性)IA(保障,PTO*PDRR*)……清华-威视数据安全研究所实施价值减少风险损失2000年2月7日美国8大知名网站瘫痪损失12亿美元ebay:1999年6月12日:22小时故障,损失:$3M-5M+26%股票市值损失AT&T:1998年4月13日:6-26小时故障,损失:$40M用于折扣确保持续发展9.11生存启示(1200/400/6%)满足商业需要服务于全球客户的复杂性,以及消费者的高期望值据介绍是否引入有效的BCM机制,已经成为一些发达国家政府机构与企业选择合作伙伴或供应商的一个必要条件———————————————————————————————已经成为现代企业的管理战略之一Meta预测:在全球大公司中用于灾难恢复管理的投入从4%上升到7%清华-威视数据安全研究所灾难恢复-未来法规遵从的要求法规遵从——法律的高度的要求2004年,国际“法规遵从年”国际,超过16000部法规沙宾法案Sarbanes-OxleyAct、全美证券交易商协会行为规定(NASD3110)美国健康保险便利和责任法案(HIPAA)、联邦条例21CFR第11部分FDA、NYSE、AMEX、FERC、……国内《国家信息化领导小组关于加强信息安全保障工作的意见》(中办发[2003]27号)《关于做好重要信息系统灾难备份工作通知》(信安通[2004]11号)《重要信息系统灾难恢复指南》(2005.5.26广东南海)……清华-威视数据安全研究所二、灾难恢复技术概览–高可用性技术–数据备份技术–数据复制技术–远程集群技术–持续数据保护技术–其他关键技术清华-威视数据安全研究所系统停机原因及防护技术•时间点复制•备份•数据仓库•远程备份•远程复制•系统热备•高可用性技术•磁带备份•数据复制•时间点复制人为过失32%计算机病毒7%硬件或系统故障44%站点灾难3%软件故障14%•时间点复制•备份清华-威视数据安全研究所灾难恢复技术思路-3R冗余性(Redundancy)灾难恢复实现的基础可恢复性(Recoverability)确保冗余的内容能在灾难发生后可以使用远程性(Remoteness)确保能够抵御灾难的影响清华-威视数据安全研究所高可用性技术设备冗余技术路径冗余技术系统冗余技术技术特点:减少停机时间保护内容全面本地的保护措施基础容灾技术切换是关键SANFabric清华-威视数据安全研究所数据备份技术Host-Based备份架构LAN-Based备份架构LAN-Free备份架构Server-Less备份架构Zero-impact备份架构相关技术数据恢复备份策略虚拟磁带库压缩技术……技术特点数据剥离-离线可以抵御逻辑错误抵御大灾难需要远程备份或传输适合业务对数据丢失不敏感对应用停机不敏感其他容灾技术的基础LANNTUNIX存储区域网清华-威视数据安全研究所数据复制技术基于存储子系统数据复制基于存储网络层数据复制基于卷管理器数据复制基于应用数据复制技术特点数据在线状态需要配合时间点技术抵御逻辑错误抵御大灾难需要远程数据传输适合业务数据很重要远程应用集群基础清华-威视数据安全研究所远程集群技术主要技术架构1+1或N+1OS-Based或Application-Based全冗余架构实现集群冗余服务器、冗余应用、冗余信号传输路径、冗余数据访问路径、……切换是关键应用切换数据切换访问地址切换保护应用的运行状态清华-威视数据安全研究所持续数据保护技术“持续数据保护是一套方法,它可以捕获或跟踪数据的变化,并将其在生产数据之外独立存放,以确保数据可以恢复到过去的任意时间点。持续数据保护系统可以基于块、文件或应用实现,可以为恢复对象提供足够细的恢复粒度,实现几乎无限多的恢复时间点”——SNIA-DMF-CDP(SIG)★数据丢失量少★抵御逻辑错误★更容易恢复★备份窗口小★主机影响小清华-威视数据安全研究所DR技术比较保护方式数据丢失量(RPO)系统恢复时间(RTO)高可用性减少停机时间本地、需要配合其他技术实现灾难恢复备份/恢复离线数据周→天→小时周→天→小时复制/恢复在线数据分钟→秒天→小时全局集群在线数据和系统分钟→秒小时→分钟→秒持续数据保护在线数据分钟→秒小时→分钟→秒清华-威视数据安全研究所三、灾难恢复实施概述管理体系建设过程最佳实践相关标准ProcessPeopleProductPlan需求分析确定策略编制计划测试部署维护更新项目启动实施建设管理体系建设过程清华-威视数据安全研究所灾难恢复管理体系模型ProcessPeopleProductPlan清华-威视数据安全研究所管理体系要素-流程(Process)日常维护和预警应急响应、评估与声明业务紧急接续、过渡期处理重新安置及启动……——————————————————————按照规范和最佳实践:预防灾难,降低风险发生的概率高效行动,降低灾难造成的损失清华-威视数据安全研究所管理体系要素-团队(People)领导组业务恢复操作组技术功能操作组外部协调和联系人员设备和软件供应商联系人外部协作机构……————————————————————————————人是流程的执行主体和关键因素合理架构、职责、人选、后备、培训、管理清华-威视数据安全研究所管理体系要素-设施和技术(Product)设备包括能够保证数据恢复和业务运行的信息系统基础设施主机、网络、卡车、打印机、……场地指挥、发布、系统、办公、……冷场地/温场地/热场地/移动场地/商业场地/……技术和方案高可用性技术数据备份与恢复技术数据复制和迁移技术远程集群技术其他关键技术—————————————————————————————技术决策要素:RTO、RPO、保护距离、TCC、保护对象、……清华-威视数据安全研究所管理体系要素-计划(Plan)(例)目标和范围组织和职责联络与通讯紧急响应流程恢复及重续运行流程灾后重建和回退保障条件附录简明扼要清华-威视数据安全研究所灾难恢复建设建设过程模型风险分析和BIA确定策略编制计划测试部署维护更新项目启动实施建设清华-威视数据安全研究所实践考虑时间$$$t0业务成效解决方案成本t1$1t1=恢复时间目标(RTO)清华-威视数据安全研究所实践考虑自建灾难恢复中心:模式1:本地站点生产,远程站点开发和测试模式2:在远程站点进行磁带备份,无需运送磁带模式3:在各站点间平衡应用负荷模式4:在远程站点设置数据仓库并提供决策支持等等……服务外包专业规划、能力维护、测试演练、……清华-威视数据安全研究所SHARE78模型Tier7-接近零或是零数据丢失,远程数据镜像,并且业务环境可进行高自动化的业务接管Tier6-接近零或是零数据丢失,远程数据镜像保证数据的完整性和一致性Tier5-软件级的,两地点-两阶段提交(交易完整性)Tier4-批量/在线的数据库镜像或日志的传输,或重复的时间点拷贝Tier3-电子链接传输Tier2-PTAM卡车运送+热备份站点Tier1-PTAM开车运送访问专门的远程灾备中心可用的备份中心时间点备份15分钟1-4小时4-8小时8-12小时12-16小时24小时好几天恢复需要的时间(RTO)费用清华-威视数据安全研究所《重要信息系统灾难恢复指南》用户灾难恢复系统组成数据备份系统灾难恢复预案备用网络系统备用数据处理系统备用基础设施技术支持能力运行维护管理能力清华-威视数据安全研究所谢谢欢迎交流清华-威视数据安全研究所侯海波houhaibo@tsinghua.org.cn
本文标题:清华-威视数据安全研究所
链接地址:https://www.777doc.com/doc-1265262 .html