您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 服务器双机热备建议方案(共四个部分)..
龙加飞项目方案(第一部分)ROSE双机热备解决方案第2页共49页龙加飞前言数字化建设是一个庞大而复杂的系统工程,其整体系统由上百个业务子系统组建而成,而这些系统间又有频繁的数据交换和业务联动,数据/信息中心系统的建设和部署是整个数字化系统建设的核心和基础,其架构设计是一项复杂的工作。本方案提出双机热备硬件平台基础架构的概述。本方案针对数字化基础架构,帮助各个层次上保持正常、健康的运行。具体方案如下:一、高可用性评估:对IT可用性计划、流程、过程、角色、职责、报告、控制和服务水平实现情况进行分析;通过事后分析、故障成本或组件故障影响分析技术,对可能发生的故障进行分析;二、高可用性规划与设计对高可用性进行规划,包括计划、计划管理、报告和服务水平管理、高可用性流程和过程设计,包括角色和职责。三、高可用性实施各种服务器优化与整合服务规划、设计和实施。四、容灾规划与实施服务数据中心和灾备中心连续性接管服务,灾难恢复演练计划制定与实施。第3页共49页龙加飞一.系统环境1.1方案业务简述本方案的核心是统一的高性能的NAS架构,大部分数据都存储在NAS的环境中,通过交换机连接不同的数据库服务和应用服务器进行各种业务处理。为支持越来越高的业务连续性要求。二.关健业务连续性系统设计2.1基础架构2.2系统设计说明1.服务器、存储和软件系统本方案的核心是统一的高性能的NAS架构,大部分数据都存储在NAS第4页共49页龙加飞的环境中,通过交换机连接不同的数据库服务和应用服务器进行各种业务处理。根据我们对业务系统的分析,充分满足对系统数据容量的规划,建议配置如下:2两台服务器建议选择IBMX3650M4,每台建议配置如下:IBMSystemX3650M4服务器类型2U机架式CPU八核至强E5-2650(2.0G主频/20MB三级缓存/最高支持1600MHz内存频率),可扩展至2个处理器内存(RAM)2*8GB1333MHzRDIMM内存硬盘4*300G2.5HDD网络4口千兆网卡光驱DVD光驱HBA卡IBM6GbSASHBA*2电源双电源冗余磁盘阵列建议选择IBMDS3512,建议配置如下:IBMDS5020控制器类型单控制器硬盘配置2TB7.2K3.5NLHDDSAS*4互联线3mSASCable*2电源双电源冗余双机软件选择RoseHA一套,配置如下:RoseHA双机容错系统RoseHAforWindowsWindows2000/2003/2008Serverforx86-64(Standard/Advanced/DatacenterEdition)第5页共49页龙加飞操作系统要求选择支持大内存和硬盘RAID功能。两台IBMX3650M4双机系统为数据库服务器,两台互为备份,这大大提高了系统的可靠性,在任意一台服务器发生故障时整个系统能够继续安全良好的运行。数据存储方面,根据业务要求,确定了数据集中结构、数据冗余备份写入,服务器通过交换机和DS3512磁盘阵列组网。为提供存储底层可靠性,我们建议配置1台DS3512阵列柜,阵列各划分划分多外逻辑卷—供不同的应用服务器使用。数据库文件和控制文件、应用程序文件全部建议放置在磁盘阵列上,在发生双机切换时无需手工同步文件。2.3系统方案特点存储使用阵列,即稳定可靠、绝对数据安全而且成本较低,充分节省用户投资;服务器、网卡、电源模块等关健设备全部使用冗余设计,无单点故障;双机软件快速反映,错误检测时间小于10秒,故障切换及恢复时间一般在10-20秒;双机软件GUI与Server分离,可随时中断GUI而不影响Server的运行;支持JOB和BRINGIN/BRINGOUT、在一台SERVER上停止JOB不会导致FAILOVER在同一块网卡上建立多个活动的IP地址,支持多个JOB的运行第6页共49页龙加飞自动切换:当系统出现故障时(如:系统宕机、HA进程/应用进程被杀掉、RS-232、SCSI、光纤、网络线缆断开),RoseHA将确定故障原因,并采取相应对策,并将这些应用切换到备份服务器上。而故障服务器中未受影响的应用不会被切换,既不会受任何影响。不需要系统管理员干预。三.附录3.1RoseHA双机容错系统RoseHA是利用共享磁盘阵列实现系统高可用性,保证应用系统7*24不间断运行的软件产品。ROSEHA软件同时安装在两台主机上,用于监视系统的状态,协调两台主机的工作,维护系统的可用性。它能侦测应用级系统软件、硬件发生的故障,及时地进行错误隔绝、恢复,以最低成本提供用户几乎不停顿的计算机作业环境。RoseHA以其稳定、可靠,在windows2000、windows2003、windows2008服务器的容错软件中占有绝对的优势,同时也成为国内绝大多数的磁盘阵列柜厂家的OEM容错软件。第7页共49页龙加飞工作模式主从方式(Active/Standby)主机工作,从机处于监控准备状态。当主机宕机时,从机接管从机的工作,待主机恢复正常后,按使用者的预定以自动或手动的方式将服务切换到主机上运行。双工方式(Active/Active)两台主机同时运行各自的服务工作,且相互监测对方的情况。当一台主机宕机时,另外一台主机立即接管它的工作,保证工作不间断。譬如:A机运行ORACLE数据库应用,B机运行IIS网站应用。第8页共49页龙加飞特点自动切换当系统出现故障时(如:系统宕机、HA进程/应用进程被杀掉、RS-232、SCSI、光纤、网络线缆断开),RoseHA将确定故障原因,并采取相应对策,并将这些应用切换到备份服务器上。而故障服务器中未受影响的应用不会被切换,既不会受任何影响。不需要系统管理员干预。支持多条心跳路径可以将网线和RS-232串口线作为在RoseHA软件的心跳路径。配置多条心跳路径可以避免系统的单点故障。两台服务器的信息交换可通过:RS232、TCP/IP自动检测在集群系统的每一台服务器内,RoseHA具有两个核心进程,它们互相监控,如果其中一个进程失败,另一个进程会立即进行恢复。第9页共49页龙加飞丰富的附加功能提供不同的针对特定应用的Agent程序,使服务监控更切实际,更加有效;提供用于开发Agent程序的应用程序界面(API),使用者可针对特定的服务编写Agent程序,执行与特定服务相关的状态诊断及错误恢复工作的。RoseHA采取高可靠的错误检测和故障恢复机制减少系统宕机,停机时间并防范错误,提供故障警告;RoseHA可设定故障排除后自动或手动回复(switchback);RoseHA安装时不需要修改操作系统的核心、更改应用软件,也无需特殊的硬件;RoseHA提供基于GUI的监控中心,管理员能查看ROSEHA的状态、检查错误信息和警告、修改系统参数及从远程工作站管理ROSEHA系统;RoseHA支持各种数据库,包括ORACLE、Sybase、Informix、DB2、MySQL等。PrivateNet私用网络两台服务器通过私用网络心跳(HeartBeat)信号,使两台服务器能够相互了解对方的运行情况。为了避免不必要的失效切换,最好建立两条独立的物理路径作为通讯路径。RS-232SocketPrivateNet:配置服务器空闲的串口作为一条通讯路径。第10页共49页龙加飞TCP/IPSocketPrivateNet:两台服务器的网卡用反线(backtoback)直接或通过LAN建立一条通讯路径。如果所有的私用网均失效,服务器仍然可以用公用侦测对方服务器的可用性。如果对方服务器仍然可用,不触发接管动作;如果对方服务器不可用,立即接管动作。PublicNet公用网络客户端通过此网络与服务器通信,当两台服务器互为备份。对于不同的服务,可以用不同的公用网连接到两台服务器。ROSEHA支持TCP/IP协议,可以在EthernetFastEthernet、FDDI和ATM网上运行。管理工具友好、直观、易于操作的GUI界面有关ROSEHA的配置都可以在GUI中完成,支持动态配置和实时同步网卡的状态,磁盘的状态都可在GUI中显示出来第11页共49页龙加飞第12页共49页龙加飞监控的对象资源VolumeIP地址计算机别名共享文件NT服务用户自定义工作原理系统启动后,ROSEHA首先启动HAManager管理程序,根据高可靠性系统的配置结构初始化,然后启动必要的服务和代理程序来监控和管理系统服务。HA代理程序用来监控、监测、诊断和管理硬件软件服务。代理程序检测到该服务器处于活动状态,HAManager就会认为该服务处于活动状态,HAManager会定时通知后备服务器上的HAManager,其每项服务处于正常。第13页共49页龙加飞当代理程序检测到某个服务发生故障时,它就通知HAManager管理程序。HA软件首先会重新启动该服务多次(可由用户设定)。如果启动不能成功,该服务会由HA转移到后备服务器上。HA周期性地检测系统硬件的状态,如果硬件发生故障,HA会把与该硬件相关的服务转移到后备服务器上。当某项服务发生转移时,HA首先在运行服务器上停止该服务,之后,由备份服务器上的HA在备份服务器上启动该服务。由于停止和启动该服务需要一定的时间,所以,当服务被切换(转移)时,该服务会有短暂的中断,转移完成后,服务自动恢复正常运行。考虑到一些数据库系统(如ORACLE、SYBASE、INFORMIX等)以及其他一些应用软件(如DominoServer、等),ROSEHA在HA管理模块(HAManager)的基础上,提供了一系列的Agent软件模块。Agent为一个软件监视模块,监控数据库服务或其他应用服务的运行。当运行服务器发生故障时,由Agent向HA主控软件请求,进行相应的处理动作。总之,ROSEHA软件极大程度上减少了人的介入,提高了系统的可靠性与安全性,使服务能可靠的运行。第14页共49页龙加飞4.2IBMX3650M4服务器4.3IBMDS3512存储IBMSystemStorageDS3500易捷版以可承受价格提供性能及灵活性而无需牺牲可扩展性,效率及易用性在IBMSystemStorage®DS3500Express®中,IBM将一流的研发能力与业界领先的6Gbps主机接口和驱动器技术相结合。凭借其简单、高效而又灵活的存储方法,DS3500成为全面集成Systemx®服务器、BladeCenter®和PowerSystems™存储的经济高效的解决方案。DS3500以适合大多数客户预算的价格带来了大量改进,为入门级存储用户提供了卓越的性价比、功能、可扩展性和易用性。DS3500易捷版旨在提供•入门级价格,可升级至中端存储的性能和可扩展性存储方案•帮助降低客户能耗开支和环境影响的高效方案要点•6GbpsSAS系统以入门级价格提供中端性能和可扩展性•数据整合可在整个组织内确保数据的可用性和效率•可在当前和未来实现成本节省的节能实施•直观而又功能强大的存储管理软件中内置的专业管理技术第15页共49页龙加飞支持多达96个驱动器,与上一代系统相比可扩展性翻倍。通过动态增加驱动器机柜(多达7个EXP3512,4个EXP3524扩展机柜或以上两者混合使用)可实现几乎零停机时间,可快速无缝地对日益增长的容量需求作出应对。通过将服务器的I/O请求分布到大量的驱动器上,该可扩展性同时也改善了系统整体性能。可在当前和未来实现成本节省的节能实施随着能源消耗的增加及IT空间的制约,在有限的空间内,努力减少IT硬件功耗已迅速成为众多企业的IT热点问题。为应对这些挑战,IBM的DS3500系列在节能实施方面实现了大跨步飞跃,推出新的节能特性的同时也不影响性能、可扩展性或功能性。更小巧的2.5英寸SAS驱动器是DS3500支持的多种驱动器之一,比3.5英寸驱动器提供多达3倍的每瓦能耗的IOPS,使得在相同2U机架空间中可使用驱动器的数量翻倍。2.5英寸驱动器以较小尺寸同样提供了出色的IOPS性能,同时最小化对能耗或散热的影响。节能电源保证的正是“节能”二字。通
本文标题:服务器双机热备建议方案(共四个部分)..
链接地址:https://www.777doc.com/doc-4640552 .html