您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 解决方案 > HCS-Solution-IT-华为阵列双活解决方案-01售前培训
华为阵列双活解决方案-售前培训HCS-Solution-IT课程负责人:余正华部门:数据中心MKT1内容简介:本课程主要介绍华为阵列双活的相关知识,主要从容灾的挑战、华为容灾解决方案全景图、应用场景、阵列双活的技术详细解析、亮点、客户价值、竞争分析和案例来进行讲述面向对象:总代、一代、金银牌课程目标:通过本课程学习,学员应了解华为容灾解决方案进展,熟悉华为阵列双活特性,掌握华为阵列双活的客户价值和亮点,并在市场拓展中进行应用版本信息(含发布/修改时间):发布时间:2016-12-09本次修改时间2016-12-09课程简介2Page2课程目录华为容灾解决方案OverView华为阵列双活解决方案解析为什么要做容灾?华为阵列双活竞争分析案例分享3IT系统业务连续的重要性媒体医疗零售业制造业电信能源金融服务200280648160110639单位:万美元来源:NetworkComputing,theMetaGroupandContingencyPlanningResearch每小时停机损失火灾设备故障停电病毒爆发4影响IT系统业务连续性的灾难类型区域性灾难每年的发生频率单次发生的损失磁盘故障组件故障电源故障高低低高自然灾害应用中断数据损坏网络问题恐怖行动/国内动乱设备故障数据中心故障建筑火灾空调故障统计显示:97%的局部故障会导致企业对外业务运行中断;3%的全局故障引起企业数据丢失,可能导致企业消亡;如何有效应对故障和灾难对业务连续性带来的挑战---建设容灾系统5灾备发展的新挑战海量数据业务永远在线传统容灾模式投入大,利用率低,如何提升投入产出比?高端存储只能复制到高端存储,容灾设备利用率低,如何提升投入产出比?容灾中心的资源如何更好的利用和共享,降低容灾TCO?灾备数据如何有效利用,实现增值?容灾系统管理范围广、难度大,如何简化?人力有限,如何高效地完成容灾业务来支撑企业持续运作?容灾系统建设涉及服务器、网络、存储等设备,系统复杂,容灾业务众多,如何管理和维护?容灾系统如何有效应对数据增长,保证业务在线?容灾系统如何将对业务的影响降至最低,实现业务零中断、数据零丢失?数据量增速远超带宽增速,如何快速完成数据容灾?6Page6课程目录华为容灾解决方案OverView华为阵列双活解决方案解析为什么要做容灾?华为阵列双活竞争分析案例分享7华为容灾解决方案全景图本地高可用方案同城容灾方案异地容灾方案本地生产中心同城容灾中心异地容灾中心本地高可用解决方案双活数据中心解决方案主备容灾解决方案两地三中心容灾解决方案主备容灾解决方案≤100km>100km8方案架构亮点真双活6层双活架构,业务级双活;业务0中断,数据0丢失;可视化全局拓扑、集中告警故障自动切换、恢复高性能HyperMetro性能提升30%100KM与本地性能一致生产中心1SAN生产中心2SANWANHyperMetroVMVMVMVMVMVMVMVMVMVMVMVMOther华为华为Other双活数据中心解决方案9方案架构亮点秒级PROIO级的数据复制功能,RPO≈0;可视化全局拓扑、集中告警自动化,一键式容灾演练、恢复TCO低存储高、中、低端互通异构、利旧生产中心SAN容灾中心SANWANHyperReplicaitonVMVMVMVMVMVMVMVMVMVMVMVMOther华为华为Other主备容灾解决方案10方案架构亮点高安全3份数据容灾范围更大可视化全局拓扑、集中告警自动化,一键式容灾演练、恢复平滑扩展同城平滑扩展到两地三中心级联、并行灵活部署SAN异地容灾中心生产中心同/异步复制SAN同城容灾中心异步复制AAA’A“SAN异地容灾中心SAN生产中心同/异步复制SAN同城容灾中心异步复制AAA’A“级联架构并行架构SAN两地三中心容灾解决方案11方案架构亮点业务级高可靠数据0丢失业务0中断HuaweiOtherSANVMVMVMVMVMVM本地高可用解决方案12Page12课程目录华为容灾解决方案OverView华为阵列双活解决方案解析为什么要做容灾?华为阵列双活竞争分析案例分享13HyperMetro阵列双活架构WAN数据中心A生产存储数据实时同步仲裁设备数据中心B生产存储SANIP网络IP网络OracleRAC集群VMwarevSphere集群FusionSphere集群……在数据中心A和数据中心B各部署一套华为OceanStorV3存储,部署为双活模式,为两数据中心业务主机同时提供读写服务。任意数据中心故障,数据零丢失。基本原理A-A架构:双活LUN,双站点均可读写,数据实时同步高可靠性设计:双重仲裁机制,跨站点坏块修复,提高系统可靠性高性能设计:提供多种性能优化手段,减少站点间交互延时,业务性能提升30%灵活扩展设计:支持异构,支持与快照、远程复制联动,可扩展为两地三中心容灾方案HyperMetro存储双活设计FC/IPSANFC/IPSAN14HyperMetro组网设计网络互联需求支持10GE、8GFC以及16GFC互联协议同城链路SLA设计链路复用(包括心跳互联、双活、复制等),组网简单优先传输:心跳双活&同步复制IO流异步复制IO流仲裁链路设计支持10GE、GE网络,带宽2Mbps以上,IP可达同城互联及仲裁网络设计仲裁设备HostHostFC/IPSANFC/IPSAN10GE/FC最佳实践组网原则HyperMetro同城互联网络与主机、存储互联网络保持一致、简化组网V3同城互联端口与前段主机端口不复用15A阵列B阵列主机跨站点双活AA集群双活成员LUN双活成员LUN133445双活LUNHyperMetro数据双写流程1.主机下发IO写请求2.申请分布式锁3.本端阵列向本端Cache写入数据,同时将写请求发送远端阵列4.本端写入数据成功,远端数据写入成功并返回本端阵列写成功5.本端和远端都写入数据成功,向主机返回写入成功2HyperMetro双写流程WriteIO16HyperMetro数据一致性保障双活成员LUN双活成员LUN双活LUN分布式锁互斥跨站点双活AA集群主机主机阵列A阵列B应用集群数据中心A数据中心B存储层数据一致性保障I/O双写确保数据一致系统正常情况下,任意应用IO数据下发,都要同时写到两台阵列才返回主机,确保两台阵列数据实时一致;单存储不可用时,记录数据差异其中一台存储不可用时,仅写正常存储,同时将业务运行时间段的数据变化记录到DCL(DataChangeLog)空间,待不可用阵列修复好并接入系统后,通过DCL记录的信息,将数据增量写入存储;分布式锁机制(DLM)通过分布式锁机制,确保主机对同一存储地址的数据访问时,由其中一台写入,确保数据一致性。应用层数据一致性保障跨站点数据库、应用集群部署,共享存储架构IO双写,数据实时一致17双活增量同步原理双活PairDCLDCL1233446①主机写IO下发至阵列②记录本端阵列双活Pair的DCL,该IO位置为脏。③同时写本端和远端阵列cache。④远端阵列和本端阵列均返回写成功。⑤清除DCL脏数据。⑥返回主机写IO成功。网络配置5DCL在创建双活Pair时,自动在该LUN所属Pool内创建,对用户不可见DCL空间预留:如果阵列只部署HyperMetro双活,建议预留Pool的千分之一空间。如果和快照、复制等其它特性混合部署,建议预留Pool的百分之五空间。双活在故障后的恢复过程中,数据同步依赖DCL进行增量同步,同步速率可以随时手动修改。18HyperMetro仲裁设计-仲裁部署方案有第三方仲裁站点(推荐)无第三方仲裁站点•仲裁设备部署在第三方站点,与双活的两个数据中心处于不同的故障域•优选:将仲裁设备部署在优先站点•备选:不部署仲裁设备,设置站点间的静态优先级(优先站点故障,业务将无法继续运行)仲裁部署•仲裁设备:物理服务器或虚拟服务器•仲裁链路:IP可达即可•仲裁模式:支持静态优先和第三方仲裁双重模式•仲裁粒度:以业务(pair或一致性组)为粒度仲裁。存储资源池仲裁盘1仲裁设备存储阵列A存储阵列B优先站点19ABDC2Storage存储Qs12GE/10GE网络Host(Redhat/SuseLinux)上两个端口绑定。每个控制器提供一个GE/10GE端口作为仲裁端口,所有端口配置为同一个网段的IP地址即可。如果不绑定端口,可以使用其中一个端口连接阵列A,另一个端口连接阵列B,则划分为2个VLAN。网络配置时延:建议时延RTT≤50ms。带宽:建议带宽≥10Mb/s。丢包率:≤0.1%。不支持NAT转换链路要求双活仲裁配置ABDC1Storage操作系统:Redhat6.x,Suse11,要求64bit。硬盘空间:推荐100G。内存:推荐8GB仲裁服务器配置仲裁组网连线20静态优先模式仲裁部署阵列A阵列B心跳丢失静态优先1、双活心跳机制:阵列周期性发送心跳,以确认远端阵列是否正常工作2、静态优先模式:当与远端阵列心跳异常时,约定A”存活”,B”自杀”3、约束与限制:如果阵列A故障,B阵列仍然按照心跳异常处理,B”自杀”导致业务中断4、部署建议:优选第三方仲裁模式,当A与B失去联系时,通过仲裁来区分设备故障和中间链路故障这两种场景21第三方仲裁模式1、集群心跳机制:阵列周期性发送心跳,以确认远端阵列是否正常工作。2、触发仲裁的条件:只有与远端阵列心跳异常时,才会触发仲裁。3、仲裁设备故障:仲裁设备故障,不影响双活业务,且自动转换为静态优先模式分裂成子集群心跳异常抢占仲裁设备存活/自杀说明:非优先站点延迟发起抢占命令,以保证优先站点优先存活22站点A站点B服务器服务器通用方案按业务粒度仲裁站点A站点B服务器服务器ERP一致性组CRM一致性组OA一致性组Web一致性组以业务粒度仲裁,链路故障,业务体验不下降通用方案:站点间链路故障,业务全部切换到一个站点运行HyperMetro方案:•每个业务一致性组,制定独立的仲裁优先策略,即一部分一致性组的优先站点设置在站点A,另一部分一致性组的优先站点设置在站点B.•链路故障时,部分业务在站点A运行,部分业务在站点B运行,业务性能不下降。•链路故障恢复时,完成双边差异化数据同步按业务粒度仲裁—一致性组仲裁ERPOACRMWebSite优先站点链路故障,导致非优先站点全部故障,所有业务切换到站点A链路故障,站点A和站点B可按设定优先级分别对不同业务系统提供服务CRMWebSiteERPOAERPOACRMWebSiteCRMWebSiteERPOA23双活仲裁模式双活Pair001双活Pair002双活Pair003双活Pair001双活Pair002双活Pair003双活一致性组001双活Pair之间的优先阵列可以不相同仲裁时按Pair进行仲裁,Pair位于优先阵列侧的LUN将优先发起仲裁抢占行为双活Pair仲裁优先优先优先优先优先优先优先双活一致性组内的双活Pair可以拥有不同的优先阵列,但是一致性组内所有Pair的优先策略将失效,将使用一致性组的优先策略一致性组删除后,原Pair将继续使用自己的优先策略双活一致性组除仲裁策略外,IO下发时也将保持其顺序,建议同一种业务或者有严重相关业务配置为双活一致性组。双活一致性组仲裁24HyperMetro仲裁设计--故障场景处理单点故障场景处理结果故障场景:仲裁服务器故障处理结果:S1、S2继续运行,自动进入静态优先模式故障场景:S1故障处理结果:S2继续运行故障场景:S2故障处理结果:S1继续运行故障场景:阵列间链路中断处理结果:S2失效,S1站点阵列继续运行故障场景:S1阵列与仲裁服务器的链路中断处理结果:S1、S2继续运行故障场景:S2阵列与仲裁服务器的链路中断处理结果:S1、S2继续运行组合故障场景处理结果故障场景:S1与QS、S2与QS链路同时或先后中断处理结果:S1、S2继续运行,自动进入静态优先模式故障场景
本文标题:HCS-Solution-IT-华为阵列双活解决方案-01售前培训
链接地址:https://www.777doc.com/doc-6953589 .html