您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > NEC容错服务器及存储系统实现远程容灾方案
NEC容错服务器及存储系统实现远程容灾方案----NEC远程容灾方案1、远程异地容灾备份技术远程异地容灾功能是指当用户的主要业务应用系统所在环境由于遇到火灾,地震以及人为因素等意外情况而导致整个系统网络瘫痪时,通过异地的灾难备份中心的备份系统和网络,恢复关键性业务运行,确保数据的一致性和可靠性。而实现完整灾难恢复功能的关键就是如何保证主应用系统中心和备份中心存储数据的实时一致性。容灾主要是预防场地问题带来的数据不可用性,这些场地问题包括:电力中断:供电部门因各种原因长时间的中断;电信中断:各种原因造成的通信线路破坏。自然灾难:地震,火灾,水灾等。场地迁移:IP部门决定将数据中心迁移到其它地方等。作为企业的关键业务,任何原因造成的业务中断都将影响其经济收入,降低市场分额,丢失客户,甚至造成企业破产。容灾系统将这种“场地”故障造成的数据不可用性减到最小。即当灾难发生时,容灾系统保证(1)数据在远程场地存有一致、可用的拷贝;(2)应用立即在远程现场运行。1.1异地容灾异地容灾系统的核心就在于在不同的地方将灾难化解,在实践中主要表现为两个方面:一是保证企业数据的安全;二是保证业务的连续性。由于工作站点和灾难恢复站点运行同样的系统,包括操作系统、基础数据库和应用软件,并通过数据复制管理器完成在线和实时的本地复制,或者通过光纤通道的远程数据复制。假如工作站点发生灾难,不能再继续工作,这时容灾中心会将业务数据及时恢复到备用服务器上,并自动将业务切换到备用服务器,然后实现业务的远程切换,恢复系统不间断的运行,在容灾中心实现应用的异地容灾,这个过程只需要几秒或者几分钟的时间。与在单个数据中心的高可用性相比,异地容灾对系统提出了更高的要求。异地容灾系统比集群系统能提供更高的高可用性和更快速的群集信息处理能力。集群系统被放置在同一个地理位置或一个机房里面;而容灾系统至少需要两个机房,或分别放置在不同地理位置上。集群系统中的每个成员之间的距离通常在三公尺之内;但容灾群集系统的两个机房之间的距离可以达到几百或者上千公里。一旦灾难出现,如洪水、火灾、地震或恐怖分子的骚扰,只有不同地理位置的群集系统之间的相互“接管“才可以保证整个网络系统的正常运行。集群系统的投资比较适中,较容易被用户接受;而容灾系统的投入非常大,需要立足长远的投资眼光,目前,国内各个行业都比较重视对容灾系统的投入。异地容灾的核心就是在工作站点以外的地方将灾难化解,所以异地容灾解决方案的基本原理就是在工作站点一定距离之外设立灾难恢复站点,然后通过网络设备将生产站点和灾难恢复站点连接起来,以实现实时的数据同步。异地容灾解决方案以存储区域网络为基础,在存储区域网络与网络之间采用光纤通道交换机来实现连接。异地容灾系统的关键技术包括网络技术、存储技术与解决方案。从网络层面而言,无论是ATM网络还是光纤网络,都已经在世界各地得到了广泛的应用;在存储技术方面,RAID、磁盘等基础技术已经成熟,磁盘阵列的应用已经遍布全球每一个角落;存储区域网络(SAN)在世界各地也得到了全面的认同。因此,容灾方案的核心是两个关键技术:数据复制和应用的远程切换。1.1.1数据复制的分类存储复制也有两种方式可以实现:在存储阵列级或主机级。基于阵列(或叫硬件)的存储复制通常价格昂贵,需要许多专用硬件,但往往最昂贵的费用是在远程连接的线路费用上,而且这种复制一般只能在同种阵列间进行。主机级的数据备份是采用软件的方式,在CPU级完成的,独立于所使用的阵列。数据复制采用TCP/IP标准协议完成。1.1.2基于存储系统的远程数据复制这种方法是基于磁盘阵列控制器的远程数据复制,它有在主副存储子系统之间同步/异步数据镜像的能力。对主机的资源占用很小,能保证业务正常运行下的I/O响应。缺点是占用大量的磁盘阵列资源,降低存储设备的性能;仅能实现数据的远程复制,对于应用的切换还需要软件来实现。目前能够提供此类解决方案的厂商有NEC、IBM、HP、EMC等,上述厂商的方案有以下特点:硬件厂商只支持自己的硬件存储设备传输距离限制存储设备造价昂贵,扩展费用高须配置特殊硬件软件设备占用主机资源小占用存储设备(磁盘阵列)的大量资源,影响其性能1.1.3基于主机系统的数据复制这是通过软件形式实现的数据容灾方法。数据安全性方面的公司,NEC推出了一系列的跨平台存储管理软件的解决方案。此种解决方案有如下特点:不依赖于存储硬件,用户可以灵活地选择任何厂家的磁盘阵列价格相对于硬件实现,便宜很多。两个现场间的距离不限主机资源占用(约5%)在网络带宽不满足的条件下,软件方式取代硬件实现方法,应用相对光分。1.2数据复制技术数据复制是指将关键信息(数据和环境)安全、一致、实时的存放到容灾现场。实际上,从一个服务器到另一个服务器的数据复制有很多方式可以完成。传统地,一般采用磁带传送的技术分发数据。但是,今天企业的运作完全建立在电子商务的基础上,对数据立即存取的要求越来越高,计费系统更是这样。基于磁带的容灾系统虽然简单,但是它不支持这种数据立即存取的运行模式。取而代之的是在线数据复制技术。数据复制一般有两种基本的策略来取得:存储复制:批量地将文件或数据块从一台服务器传送到另一台或多台服务器。存储复制独立于应用,这意味着运行在单台服务器上的多个应用,其数据可以同时复制到备用服务器上。应用级复制:是应用相关的,例如数据库或Web分别采用不同的复制方法。一般这种复制在交易级(表或行)完成。如果有多个应用在同一个服务器上,各自采用自己的复制技术。相比之下,应用级复制管理复杂,常常只复制数据,而不能复制应用和系统的实时运行环境,影响应用在备份服务器上启动的时间。存储复制在卷一级进行,对应用透明,具有极强的通用性,最重要的是复制整个应用环境,能够立即在备用服务器上运行应用,保证系统的高可用性。1.3数据复制实现方式软件数据复制方式具有配置灵活、价格低、高性能等特征。NECExpressCluster镜像数据复制软件提供两种复制类型:同步复制和异步复制。应用系统采用哪种复制模式,将决定于很多因素。同步复制:在同步复制环境中,系统上的应用写操作完成之前,数据必须写到复制系统中。这保证了任何时间任何情况下目标系统上的数据尽可能的新,即远程现场的数据和本地现场的数据有完全一样的影像。但是如果数据复制的网络带宽不够,同步复制可能会带来本地系统性能下降。异步复制:异步复制时,本地系统不等待对远程系统写的确认,复制软件将数据排队,在网络科研用的情况下批量的发送。NECExpressCluster采用Log技术支持异步复制,以保证远程系统上的写操作与本地的写有同样的顺序,从而维护远程数据的完整性。很多情况下,同步复制和异步复制模式结合使用。例如当网络问题发生时,同步转换成异步,问题解决后,再转回同步。从而保证容灾系统的可靠性。2、两种容灾备份方式的分析由于异步远程更新的执行,应用程序不必等待远程更新的完成,因此远程数据备份的性能的影响通常较小,并且备份磁盘的距离和生产磁盘间的距离理论上没有限制。然而,当传送中的数据在生产磁盘控制器中还没有形成数据一致组时生产中心发生灾难,这些数据就会丢失。因此在系统和应用程序重新启动之前,需要额外的数据恢复。所花费的时间和造成的影响取决于客户的环境,例如应用程序和设备配置的复杂性,更新的完整性等等。对于异步复制,提交的记录被存储在主存储器的日志中,以最大程度确保主机应用程序性能。这种模式也能帮助清除在其它复制方案中会遇到的严格的距离限制。异步复制也可以在同步复制的广域网故障时作为一个备用模式。2.1基于主机端软件的异步容灾解决方案本地的高可用系统虽然能够做到IDC数据中心和应用中心本地系统的高可用,但有一个问题,如果一些不可抗拒的因素如地震、雷击等把整个中心的一些关键系统破坏了,还是会导致应用系统的长时间中断。而对于IDC的24X7的关键业务,任何原因的短时间停顿都是不允许的,因此,有必要建设一个具有容灾功能的备份中心,当数据中心发生故障时,可由备份中心接管部分或所有的业务处理。特别是当前一些IDC已经在几个城市建立了自己的数据中心,完全可以利用现有的这几个数据中心实现数据异地复制和容灾的功能,平时数据复制对客户可以达到Load-balancing的效果,当灾难发生时则起到备灾的功能。容灾系统的数据中心建设,大致可分三个部分进行:1.备份中心主机网络存储系统的构建,以及应用系统的安装,这些可基本上与数据中心的环境一致2.建立数据中心与备份中心的数据同步传输系统3.建立基于广域网的集群系统,使得应用系统可以在广域网上进行切换对于网络连接,如果距离不超过40公里,建议采用光纤连接,同步方式是首选,但如果没有光纤资源,例如是在两个异地的城市之间,建议采用E1/T1的专线连接,当然,如果数据量很小,也可采用低速的专线连接,这里我们提出比较通用的第三方的开放系统的解决方案,以NEC公司的ExpressCluster做为方案进行说明。NEC的ExpressCluster镜像可以支持数据远程复制。通过广域网远程连接,ExpressCluster镜像可向远程备份系统同步进行逻辑卷复制,确保系统数据的高度可用。ExpressCluster镜像采用可靠的连接和监听协议,保证远程备份站点与本地逻辑卷数据的一致性,为用户关键应用的灾难备份和恢复提供了有效的手段。为了能够监测数据中心应用系统的运行情况,并能够在灾难发生时实现应用系统从数据中心到备份中心的切换,必须选用专门的广域网集群管理软件来实现。NEC的ExpressCluster软件可实现多集群的管理和应用系统的容灾。整个容灾系统结构大致如下图所示:系统的运作过程如下:1.正常情况下,数据中心和备份中心的系统均处于运行状态,但业务处理系统只在数据中心运行;同时,业务系统对数据的任何修改,会定期地复制到备份中心2.当数据中心的NECFT服务器某些部件发生故障,如进程出错、内存损坏等情况发生时,由于各部件都是冗余的,从而可以保证整个系统正常运行,也无需进行切换就可以继续运行当前的任务,比双机做CLUSTER更便于管理、更安全。3.当灾难发生,导致数据中心整个系统瘫痪时,NECExpressCluster会马上监测到这种异常情况,及时向管理员发送各种警报,并按照预定的规则在备份中心启动整个业务应用系统4.数据中心的计算机网络系统修复后,NECExpressCluster可将备份中心的当前数据复制回数据中心,然后将应用系统从备份中心切换回数据中心,备份中心的系统重新回到备份状态。由上可见,方案中所推荐的系统结构,能很好应付各种软硬件故障、人为或自然灾害对计算机处理系统的影响,保护业务系统的不简断运行,是一个真正具有容灾功能的高可用系统,能够保证IDC的业务在任何情况下都能高效稳定地运行。2.2基于磁盘端的远程镜像同步容灾解决方案提供基于逻辑单元级的实时数据备份,当主数据中心发生灾难或系统失败时,备份中心在保持数据高度完整性的基础上,可以快速实施系统恢复。基于磁盘控制器的远程同步数据备份技术,在主磁盘存储系统(primarystoragesystem)和次磁盘存储系统(secondarystoragesystem)之间通过磁盘控制器微码提供同步数据镜像功能。在灾难备份的情况下,主磁盘存储系统通常是生产磁盘系统,次磁盘存储系统通常是备份磁盘系统,为了使用意义更明确的表述,下面将把主磁盘存储系统称为生产磁盘系统,次磁盘存储系统称为备份磁盘系统。RemoteVolumeMirror同步方式确保生产磁盘与备份磁盘同步进行相同的I/O更新。不需要主机干预,应用系统不知道远程数据备份正在进行。在进行同步远程数据备份时,生产磁盘控制器必须通过FC连接将数据写到备份磁盘系统控制器,并且由备份磁盘控制器确认以后,才返回磁盘更新完成的信息。这种方法的优点是:(1)备份磁盘总是与生产磁盘同步,(2)备份磁盘系统在更新时总是于生产磁盘系统保持完全一致的顺序,以保证数据和连续更新的完整性,(3)万一在生产地点发生灾难时,不会出现数据丢失。由于备份数据总是
本文标题:NEC容错服务器及存储系统实现远程容灾方案
链接地址:https://www.777doc.com/doc-4396069 .html