您好,欢迎访问三七文档
1/13系统运维方案一、企业面临的问题1、缺乏集中的监控管理平台,运维管理人员无法主动掌握IT平台的运行情况,对主机系统、网络系统、数据库、应用系统等没有合适的手段进行监控,无法做到快速的主动预警、快速的故障定位和故障排除。2、被动的运维管理模式导致运维人员对故障后知后觉,重复劳动多,工作强度大,最终IT部门、各业务部门都不满意。3、建立在手工基础上的巡检工作,难免有主观性强、随意性强的缺点,数据不能真实反映系统的运行状态,并且一旦岗位流动,不能保证系统维护的延续性。4、IT管理部门无法掌握现有IT资源是否充分发挥了作用,系统如何配置更能满足业务发展的需要,一切都确乏科学的数据做为投资决策的依据,难免造成盲目投资、重复建设的巨大浪费。给企业带来不可弥补的经济损失。二、运维管理系统的作用1、打破传统的“分散监控、分散管理”模式,通过建立一个集中的监控管理平台,实现对整个IT系统的“集中管理、统一运维”。2、打破传统的“只有在出现问题时,才能被动应对”的后知后觉的服务模式,系统通过7*24小时不间断的监控,主动发现故障隐患,及时预警,以利于及时消除隐患,防患于未然,并能迅速定位故障,及时通知,有利于快速排除故障。3、通过建立一个集中的监控管理平台,以“全面监控、准确预警、及时通知、快速解决”的方式,记录所有监控数据,并根据需要提供分析报告,有案可查,便于进行系统的、科学的分析和总结。4、打破传统的IT部门对IT资源心中无底的状况,通过统一的集中监控管理平台,管理人员能够清晰地知道现有资源的合理性,实现资源的有机整合与充分利用,以科学数据作为投资决策的依据,避免了盲目投资、重复建设造成的巨大浪费。给企业降低了成本,提高了工作效率,提升了管理质量和企业的核心竞争力。5、打破传统的IT维护只关注IT元素问题。在系统中可以为您集中展现银行业务系统的各种信息,为领导及时了解业务状况及时决策提供便利。三、运维管理系统的功能特点1、7*24小时自动监控功能:将以往固定的阶段性系统巡检工作,变为系统自动的7x24小时不间断检测,可代替人工进行值守。直接提升了系统的IT管理自动化程度,工作效率显著提高!2、快速定位故障功能:将复杂的IT环境按照银行业务关联方式进行整合,能直观地看到整个IT系统的运行状态,及时准确的上报:是IT系统出现了什么问题,导致业务出现问题;可以迅速定位故障点,直接提高了维护部门响应及处理问题的速度。3、系统自动预警功能:通过系统7x24小时不间断检测,并根据数据进行分析,一旦情况异常,系统自动产生预警信息及时通知各位领导及管理员,为防患于未然提供强有力的帮手。4、管理及决策功能:直观的报告式系统性能统计表,使IT管理者及时了解IT系统各部分的运行状况,提供的历史性能和故障数据,为IT管理决策提供了科学的依据;并获得最直观的与业务有关的各种信息,为维护人员提供方便快捷的运维管理工具。5、确保业务系统稳定性功能:保障业务的整体稳定性,提前发现网络中存在的各种潜在问题,提前处理,使故障率大大降低,网络故障时间大大减少,用户的投诉率明显减少,提升了业务服务质量,也降低了维护成本。内网安全管理1、所有域用户不能随便更改桌面背景,保证公司使用带有LOGO的统一背景。2、所有域用户不能运行管理员已经限制的程序。3、所有域用户禁止使用管理员权限。4、配置域用户所有IE的默认设定为本企业网站,保证员工打开IE可以直接访问到公司网站,且用户不能自行更改主页。5、禁止域用户使用运行,防止打开注册表等修改系统配置(管理员除外)。2/136、隐藏所有用户的C盘,防止用户误删除系统文件,造成系统崩溃。7、禁用控制面板中“添加/删除程序”,防止用户随意添加windows组件及删除软件,造成系统问题。8、取消光盘或U盘自动播放,以防止存储介质带入病毒或木马程序。9、所有域用户禁止对IP地址进行修改。通过组策略对AD域控制器进行设置,以实现以上内容监控管理实施方案:采用卓豪公司基于ITIL(InformationTechnologyInfrastructureLibrary信息技术基础架构库)架构的软件产品:ManageEngineIT360ManageEngineIT360主要功能:利用ManageEngineIT360,可以轻松管理关键的业务应用。它采用无代理监控方法,监控应用服务器、服务器和数据库,从而降低成本,提高投资回报率。通过网络监控和带宽利用情况,管理员能够迅速排除网络性能相关的问题。利用基于ITIL的服务台,系统可以自动指派问题,提高IT服务水平。3/131、业务服务管理在IT资源中加入业务元素定义依赖关系,提高故障管理和SLA管理降低应用支持和维护费用轻松排除故障2、网络监控端到端的网络设施平台,高级故障和性能管理功能,管理WAN、VoIP电话、网络设备自动发现网络设备一系列包含设备配置的设备和接口模板3、服务器监控采用无代理方式监控服务器监控服务器负载、磁盘利用率、进程、内存利用率、磁盘I/O、服务器CPU利用率等使IT管理员确定问题的根源在于操作系统、应用还是服务器支持Linux,Windows、Solaris、AIX、HPUX等4/134、应用监控监控CRM应用、财务应用等业务关键应用通过监控Microsoft.NET、Oracl、JBoss、Tomcat、WebLogic、WebSphere和SAP,保证应用服务器健康状况和可用性监测和诊断应用服务器及其服务出现的问题,保证正常运行5/135、数据库监控监控包括Oracle、MSSQL、Sybase、IBMDB2和MySQL的异构数据库服务器环境数据库管理员可以规划资源需求,及时排除故障数据库大小、缓存大小、数据库连接时间标签,方便查看6/136、带宽监控从支持NetFlow的设备直接导出NetFlow,详细了解网络中带宽使用情况查看带宽使用图样,生成报表,无需部署硬件探针,节约成本深入了解网络流量及其模式实时掌握网络状况,以及流量如何影响网络总体健康状况7/137、IT资产管理硬件和软件资产的完整清单通过无代理方式的扫描,跟踪资产的所有关系和历史计划性的资产审计快速确定资产与业务服务或其它资产的依赖关系跟踪企业中软件的使用情况监视软件许可8/138、基于ITIL的服务台集成服务台,从一个位置管理所有交流基于ITIL的服务台包括事件管理、问题管理、变更管理和配置管理包括解决方案(知识库)模块,便于解决常见问题能够将系统告警在服务台自动转化成工单自动将工单指派给相关技术员或技术组9、性能报表界面简洁直观能够对每个监控的属性生成报表计划自动邮寄报表报表可导出为PDF、CSV或XLS格式文件可查看过去一周或一个月的历史数据9/13ManageEngineIT360产品属于软件套件,内含不同的软件以实现不同的功能。下面将以其中之一软件opmanager为例,说明其职能。灾难管理需求分析:公司现有信息平台承载着各种服务独立应用,包括:DHCP、DNS、AD、OA、SAP等,这些应用需要独立系统来控制保障安全可靠。未来随着企业的发展,将会增加WEB、SQL、MAIL等平台服务。传统解决方案及分析:传统独立的系统平台方式为了保障安全,基本上是一个应用系统对应一台服务器,如果两种应用配置在一台服务器上可能会造成业务冲突,或者一种应用由于宕机或者病毒等故障造成所有应用的停止。为了采用应用系统连续性的双机热备系统,则需要一台服务器闲置作为standby服务器。传统服务器解决方案的有诸多弊端:(1)运营和维护成本高服务器大大增加了对数据中心空间、机柜、网线、耗电量、冷气空调和人力等成本需求。(2)服务器利用率低像DHCP、DNS、AD、OA、SAP应用对服务器的CPU、内存的使用率都极低,特别是对于目前多核高性能CPU的服务器时代,有的甚至长年不会达到3-5%,绝大多数系统资源利用率通常不足15%。(3)IT服务水平差,不能快速响应业务需求服务器的硬件维护需要宕机,某些重要应用被排除在了灾难恢复的范围之外,或者有些灾难恢复时间过长,服务器与老的操作系统或者业务之间存在兼容性,诸如此类等问题都会影响IT服务水平,从而使得公司办公效率降低。(4)系统扩展性差当有新的应用系统时候,不能及时部署,需要申请购买新的服务器。这些问题直接导致IT总拥有成本(TCO)升高,IT投资回报率下降,系统可管理性降低,运营效率与响应速度降低。而服务器虚拟化技术正是解决这些问题的一个好方法,运用虚拟化技术,不仅可以大大降低TCO、提高运营效率、提高服务水平,而且虚拟化软件本身还为您提供高可用性和负载均衡特性,保证客户应用的连续性。虚拟化概念简介:10/13服务器虚拟化是在服务器上安装一个虚拟机监控器(VirtualMachineMonitor,VMM)软件,将服务器物理的CPU、内存、网卡和硬盘等资源抽象出来,映射成若干个虚拟的CPU、内存、网卡和硬盘,构成虚拟机,每个虚拟机上可运行一个独立的操作系统和若干应用软件。虚拟机的产生打破了操作系统和硬件的互相依赖性,屏蔽了硬件平台的动态性、分布性和异构性,实现了硬件资源的共享和复用,提供多个独立的、隔离的应用环境。虚拟化有如下四大特性:(1)分区:在单一物理服务器上,可以同时运行多个虚拟机;(2)隔离:在同一台虚拟机服务器上运行的多个虚拟机实例彼此完全隔离,互不影响,任何虚拟机的故障,包括病毒感染、黑客攻击等,都不会影响其他的虚拟机。(3)封装:虚拟机将硬件配置、操作系统、以及应用等整个系统封装在文件里。封装特性为虚拟机应用带来了极大的方便性(4)硬件独立:一个虚拟机可以在其他虚拟机服务器上不加任何修饰的运行,降低了软件对硬件的依赖性。建设目标:(1)先进性选择当今先进的存储技术和存储设备,保证在今后数年的技术先进性,整个系统的生命周期应有比较长的时间,在系统建成以后比较长的一段时间内能满足需求增长的需要。(2)通用性实用有效是重要的设计目标,设计结果必须满足需求并且有效、不虚设。系统设计要考虑到3-5年内的技术发展,应切实保证系统所选择的设备和系统结构都具有很好的性价比;选择设备要通用性高,具备前向和后向兼容性,支持今后对系统的扩充。支持多种操作系统和多媒体网络应用软件。(3)安全性稳定性能,容错能力强,操作、管理、维护简单并具有良好的安全性。能够在多个层次上实现安全机制。提供多种有效可行安全措施,保护数据安全。制定严密的数据备份方案和技术保障措施,当系统出现故障时,系统数据能得到及时恢复。系统应保障关键应用的连续性。保证当意外情况发生时,系统能够平稳、正常的运行和工作。(4)灵活性系统配置灵活,备用和可选方案多,能够随着内部和外部应用环境的改变随之做出相应的调整,使整个系统具有很强的升级性和可扩展性,能够适应应用和技术发展的需要。(5)高管理性整个系统可以通过完善地控制界面来管理和监控,对系统进行实时的监控和维护,降低了运行的成本。虚拟化方案:虚拟化软件:CitrixXenserver5.6服务器:IBMsystemx3650SAN存储:IBMstorageDS3500Xenserver企业级功能:动态迁移:XenMotion高可用性:HighAvailability11/13物理机到虚拟机转换:XenConvert快速置备:ProvisioningStreaming服务器管理:XenCenter动态迁移:XenMotionXenMotion允许迁移正在运行的虚拟机而无需中断服务安计划实施维护时无需停机在不同的服务器间负载平衡虚拟机高可用性:HighAvailability服务器故障时自动重启虚拟机剩余服务器上智能负载均衡可配置的保护级别和告警转换工具:XenConvert和p2v-legacyXenConvert支持Linux平台从物理机到虚拟机的转换p2v-legacy支持Windows平台从物理机到虚拟机的转换转换格式和类型:直接转换XenServer到并启动
本文标题:系统运维具体方案
链接地址:https://www.777doc.com/doc-2169839 .html