您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 其它办公文档 > 银行数据中心自动化智能运维平台需求
数据中心自动化智能运维平台项目背景、目标描述•描述项目的背景及需要解决的问题•描述项目的目标•评价项目目标是否实现的衡量指标项目背景•目前我行所负责运维的开放平台服务器已经达到了相当的数量规模,但是大多数配置管理和变更工作仍还由IT维护人员手工运维。•随着设备数量的增长、运维标准的提升、配置和运维规范的日益严格,手工运维的模式已经越来越难以实现我行在IT运维方面的高标准要求,在配置管理、变更管理、合规审计和联合排障等方面,因手工运维带来的大量繁琐工作和易出错的操作都给安全生产带来极大隐患。•从运维管理模式上看,数据的集中意味着运维管理也必须相应的向集中式的运维模式转型,如果IT还停留在传统的运维模式和运维水平,势必对集中的业务带来极大的潜在风险。项目目标•改变IT部门的传统运维模式,建立新的自动化运维模式,建设开放平台服务器自动化配置管理系统将。•从范围上来说,该系统不仅能满足目前中国XX银行IT部门对数据中心开放平台服务器的日常运维管理需求,而且应能够具备良好的扩展性,可以在未来为中国XX银行IT部门提供从数据中心到测试中心、开发中心、各分行,乃至地市分行的端到端自动化运维管理。•从功能上来说,该系统应可以为开放平台服务器的整个管理生命周期的提供一系列自动化配置管理手段,涵盖开放平台服务器规划、设计、实施和运维的各个阶段。需求分析•业务需求:–业务量估算;–……–……•应用非功能性需求:–性能需求;–容量需求;–质量需求;–业务连续性需求;–安全需求;–运维管理需求;–……–……需求分析1.配置信息自动化采集和管理2.日常巡检自动化3.审计和合规管理4.软件/补丁安装和回退5.用户权限管理6.报表管理7.代理(Agent)对目标机器的影响需求分析:1•配置信息自动化采集和管理:–自动采集各种IT资产的配置信息,包括硬件信息、操作系统信息、数据库信息、中间件信息等,并保证信息的实时性、准确性;–可以同时对许多设备进行并发操作,大幅度提高管理效率,降低人为操作失误。需求分析:2•日常巡检自动化:–取代传统的人工检查,有效确保配置规范、安全规范、版本规范在实际环境中的落实;–检查内容非常广泛,包括用内置的模板进行检查,以及由用户自定义检查,比如检查CPU利用率、表空间利用率、日志文件搜集和分析、补丁规范、配置规范、安全设置等;–检查可以由管理员触发进行,也可以在设定的时间窗口自动周期性执行,效率大大高于传统方式,并且可以实现密集的检查,及时发现和消除故障隐患,变频频救火为防患于未然,从根本上提升系统可靠性。需求分析:3•审计和合规管理:–支持配置与操作审计,包括操作用户的审计、操作时间的审计、操作内容的审计等,可以具体到用户的击键记录;–内置多种合规或最佳实践要求,包括SarbanesOxley,PCI,FISMA,HIPAA,ITIL,COBIT,COSO等;–也可由用户自定义合规策略,可以针对文件、目录、用户、组、补丁、软件包、注册表、应用配置模板等多种对象制定合规策略;–当发现不合规情况下,可以提供自动修补功能。需求分析:4•软件/补丁安装和回退:–操作系统补丁安装升级–应用补丁安装,包括:数据库补丁、中间件补丁、XXX银行自己开发应用的补丁,以及如何自动部署新的应用–软件/补丁的回退,能够回退到上一状态–以工作流方式实现对各个运维管理子系统的指挥调度和协同工作–实现IT流程完整的生命周期自动化,对流程进行闭环管理;–提供可视化工具定制流程;需求分析:5•用户权限管理:–提供集中、统一的用户认证和权限管理–实现基于角色、细粒度、灵活的用户权限控制–为实现实名制用户管理提供技术手段,消除账号共享的弊端–提供单点登录功能,避免用户记忆很多口令–支持多种外部的用户认证方式,包括LDAP、AD等需求分析:6•报表管理:–跨越多个数据中心提供全面的硬件、软件和操作活动的全面报表;–可以自动生成通用的合规报表,如Sarbanes-Oxley报表等;–可以创建可互操作的图表,提供多层次数据并可层层深入挖掘;–可以导出报表数据与其它报表工具进行集成。需求分析:7•代理(Agent)对目标机器的影响:–Agent应该支持数据中心大多数的操作系统–Agent应该对目标机器的磁盘和内存要求不高–Agent运行时占用CPU,Memory,I/O等资源少应用或技术架构图•应用架构图•技术架构图•系统示意图工单系统变更管理开放平台自动化管理系统自动化运维流程整合系统帮助台外部系统监控系统配置管理合规管理操作系统安装脚本执行日常巡检变更管理单点登录补丁管理软件分发应用可视化报表管理技术架构图HP自动化运维术语SAServerautomation服务器自动化系统CoreCoreSA的核心服务器Sliceslice和agent通讯的组件MRModelRepositoryoracle数据库SARServiceautomationreport报表管理系统OOOperationOrchestration自动化运维流程整合系统CentralServerCentralServerOO的核心服务器SQLServerSQLServerSQL服务器基础设施部署架构图•基础设施部署架构图–能够体现设备基本情况、存储结构、网络基本结构、部署位置、安全结构的示意图–描述架构设计的基本思路和推导过程–如果是现有系统,要包括现有系统的架构图基础设施部署架构图IT自动化管理软件被管设备IT自动化管理软件被管设备数据同步被管设备分行数据中心数据中心被管设备城域网/广域网开发中心应用服务器应用服务器应用服务器应用服务器具体网络拓扑图被管机器数据中心1被管机器被管机器被管机器数据中心2分行/开发中心/其他部门OO+SAOO+SA典型部署与访问方式被管机器分布部署,高可用性1002客户端http443Java10991002300130011002卫星节点被管服务器架构说明•Multi-Master–统一集中的服务器管理–避免单点故障–多个SAS核心服务器之间的数据共享•卫星节点–分担核心服务器负载–穿越防火墙–有效平衡网络带宽SA架构•SA架构比较复杂,下面做详细说明–由于xxx银行业务扩展,数据中心业随着扩充,服务器数量也不断增加,现有服务器大约为1,400台左右,考虑以后发展,如~2,250台,~4,500台,~7,200台,~8,000台等的架构CoreCapableofSupporting2,250ManagedServersCoreCapableofSupporting4,500ManagedServersCoreCapableofSupporting7,200ManagedServersCoreCapableofSupporting8,000ManagedServers容量估算•SA数据库服务器2台,建议配置如下:–处理器:CPUDual-coreProcessorIntelXeon,3.0+GHz,4颗以上–内存:16GBRAM以上–硬盘:200GB以上,SCSI–网卡:100/1000Mbps以太网卡,2个容量估算•SA服务器自动化工具后台服务器2台,建议配置如下:–处理器:CPUDual-coreProcessorIntelXeon,3.0+GHz,4颗以上–内存:16GBRAM以上–硬盘:200GB以上,SCSI–网卡:100/1000Mbps以太网卡,2个容量估算•OO流程自动化工具后台服务器2台,建议配置如下:–处理器:CPUDual-coreProcessorIntelXeon,3.0+GHz,4颗以上–内存:8GBRAM以上–硬盘:80GB以上,SCSI–网卡:100/1000Mbps以太网卡,2个容量估算•OO流程自动化工具数据库2台,建议配置如下:–处理器:CPUDual-coreProcessorIntelXeon,3.0+GHz,2颗以上–内存:4GBRAM以上–硬盘:80GB以上,SCSI–网卡:100/1000Mbps以太网卡,2个部署方案详细描述•详细的部署方案图及描述,描述需求到方案的推导过程,包括:–设备数量,设备清单,配置描述;–部署地点描述;–访问关系描述;–设备间关系描述;–网络设计描述;–存储设计描述–业务连续性设计描述;–安全设计描述;–运维管理设计描述;–……–上述内容,根据项目实际情况进行描述、补充;有关设计描述要有需求数据的支撑,要有明确的推导过程;配置信息自动化采集和管理•配置信息内容包括:–硬件信息•CPU、内存、磁盘、存储、网卡、补丁版本等信息–标准操作系统软件/补丁信息•补丁版本、xxx.rpm包版本等信息–操作系统信息•何种操作系统,具体OS版本等信息–数据库信息•Oracle、Informix、DB2的版本、补丁和安装位置、用户实例信息–中间件信息•Weblogic、Tuxedo、Websphere、MQ、Apache的版本、补丁和安装位置、用户实例信息•配置信息自动化采集和管理的解决方案–SA默认功能实现配置信息自动化•对于大多数硬件信息,标准操作系统软件/补丁信息,操作系统信息,SA默认可以自动采集,同时生成相应的报表,不需要定制–SA客户化功能实现配置信息自动化•对于数据库信息,中间件信息,可以开发OGFS脚本,把这些信息写入数据库如服务器的customattribute字段,再用BIRT报表工具自定义用户需求的报表服务器列表范例292019年7月31日星期三操作系统报表范例302019年7月31日星期三软件信息报表范例312019年7月31日星期三日常巡检自动化•日常巡检自动化内容:–包括用内置的模板进行检查,以及由用户自定义检查,比如检查CPU利用率、表空间利用率、日志文件搜集和分析、补丁规范、配置规范、安全设置等–标准操作系统软件/补丁信息•补丁版本、xxx.rpm包版本等信息•日常巡检自动化方法:–取代传统的人工检查,自动化管理–检查可以由管理员触发进行,也可以在设定的时间窗口自动周期性执行,效率大大高于传统方式,并且可以实现密集的检查,及时发现和消除故障隐患,变频频救火为防患于未然,从根本上提升系统可靠性.•日常巡检自动化的解决方案•日常巡检的内容由于每个企业,每个银行,每个数据中心都不同,没有统一的标准,需要利用现有脚本或者开发新的脚本(shell,perl,VBscript,.bat,python)开进行日常巡检.有的日常巡检需要采集某些信息如CPU利用率等,有的日常巡检只是判断某个参数是否合规(符合定义的数值),通常用SA的audit功能的customscript或者OGFS脚本来实现,相关数据会写入数据库,再用BIRT报表工具自定义用户需求的报表•日常巡检可以有管理员定义schedule定时执行,以可以立即执行自定义脚本实现日常巡检自动化范例自定义脚本:密码长度6位定时日常巡检范例定义运行时间服务器合规报表范例审计和合规管理•审计和合规的内容–用户操作行为审计•用户登陆哪台服务器、登陆时间、执行的操作命令、命令执行的时间等–业绩多种合规或最佳实践•SarbanesOxley,PCI,FISMA,HIPAA,ITIL,COBIT,COSO等这些业绩规范的合规审计–用户自定义合规策略•也可由用户自定义合规策略,可以针对文件、目录、用户、组、补丁、软件包、注册表、应用配置模板等多种对象制定合规策略审计和合规管理•审计和合规的解决方案–用户操作行为审计可以对用户的击键记录进行全程的跟踪保存击键记录的文件击键记录用户操作行为审计报表范例业界规范范例•审计和合规的解决方案–业绩规范或者最佳实践审计业界规范之HP-UX审计•审计和合规的解决方案–业绩规范或者最佳实践审计自定义合规策略•审计和合规的解决方案–用户自定义合规策略•用户可以利用SA的audit功能定义自己的合规策略自定义远程登陆timeout时间为300s审计和合规报表范例软件/补丁安装和回退•软件/补丁安装和回退的内容:–操作系统补丁•HP-UX,RedHatLinux等–应用补丁•数据库补丁、中间件补丁、XXX银行自己开发应
本文标题:银行数据中心自动化智能运维平台需求
链接地址:https://www.777doc.com/doc-20903 .html