您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 其它文档 > 机房应急方案20170608
机房应急方案2017/6/8上海市肇嘉浜路768号22楼A座2目录一、机房应急方案.........................................................................................31.1机房突发事件分类............................................................................................31.2应急处理人员组织机构....................................................................................31.3应急人员岗位职责............................................................................................31.4机房应急开关机具体措施................................................................................41.5服务器及存储设备故障处理............................................................................41.5.1排错流程......................................................................................................51.5.2应急处置具体措施......................................................................................61.5.3服务器突发情况记录文档...........................................................................61.6网络设备故障处理............................................................................................61.6.1排错流程......................................................................................................71.6.2网络系统故障突发事件分级......................................................................71.6.3应急措施......................................................................................................81.6.4网络突发事件记录文档..............................................................................91.7空调故障处理....................................................................................................91.8消防设备故障处理............................................................................................91.9维护小组成员..................................................................................................101.9.1现场服务人员联系方式............................................................................101.9.2厂商协助人员联系方式............................................................................10机房应急方案南通工贸技师学院桌面云系统解决方案3一、机房应急方案随着信息化建设的不断深入,加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力将是信息部门目前面临的一项重要任务。为应对机房可能发生的突发事件,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。1.1机房突发事件分类1.自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏。2.事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏。3.人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖袭击等引起的网络与信息系统的损坏增网点使用一个方案。1.2应急处理人员组织机构1.3应急人员岗位职责1、应急总指挥职责1)保证在任何时间,及时协调应急行动所有涉及的岗位人员;机房应急方案南通工贸技师学院桌面云系统解决方案42)提供必须的紧急响应设备;3)在紧急情况下全面负责紧急行动;2、应急副总指挥职责1)在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责;2)根据获得的应急信息下达命令。3、各相关设备负责人职责1)负责尽快收集信息向应急总指挥汇报事故情况;2)负责现场临时设备抢救和对事态的控制;3)听从上级指挥人员的指挥。:1.4机房应急开关机具体措施机房各设备关闭顺序如下:1.5服务器及存储设备故障处理机房应急方案南通工贸技师学院桌面云系统解决方案51.5.1排错流程机房应急方案南通工贸技师学院桌面云系统解决方案61.5.2应急处置具体措施1、服务器设备损坏应急处置措施A、关键应用系统所在服务器设备损坏后,应立即查明原因,使用备份服务器替换损坏设备,并立即恢复应用系统正常使用;B、立即与设备提供商联系,请求派维修人员前来维修2、服务器软件损坏紧急处置措施A、迅速查找原因,尝试重启系统。使用备份进行恢复。必要时联系开发商;B、当发现服务器感染有病毒后,应立即将该机从网络上隔离出来。并启用杀病毒软件对该机进行杀毒处理,同时使用病毒检测软件对其他机器进行病毒扫描和清除工作。经技术人员确认确实无法查杀该病毒后,应作好相关记录,并迅速联系有关产品商研究解决C、当因空调,电力等问题需要关闭所有服务器时,应遵循如下步骤:先关闭所有应用服务器和数据库服务器,再关闭存储设备。启动所有服务器时,应先打开存储设备,再打开数据库服务器,最后打开应用服务器1.5.3服务器突发情况记录文档日期故障发生时间服务器名称IP现象处理情况故障恢复时间处理工程师备注1.6网络设备故障处理机房应急方案南通工贸技师学院桌面云系统解决方案71.6.1排错流程1.6.2网络系统故障突发事件分级故障等级故障现象1级网络完全拥塞或设备宕机网络或设备处理能力严重受影响,对最终客户的业务运作有严重影响网络或设备故障对重要的客户(公司经理级或重要的部门)造成严重影响网络完全拥塞或设备宕机网络或设备处理能力严重受影响,对最终客户的业务运作有严重影响2级网络或设备的性能严重下降,对最终客户的业务运作产生重要影响部分区域网络故障一般网络节点发生故障大部分客户的网络通讯质量下降机房应急方案南通工贸技师学院桌面云系统解决方案8网络或设备的性能严重下降,对最终客户的业务运作产生重要影响部分区域网络故障3级网络或设备性能受损,但最终客户大部分业务仍可正常工作报警出错和操作命令反常网络或设备性能受损,但最终客户大部分业务仍可正常工作报警出错和操作命令反常4级其它一般的故障,不影响系统的整体运行,不影响大部分客户的使用1.6.3应急措施1、黑客攻击时的紧急处置措施A、当发现网页内容被篡改、Internet接入路由器有未知用户登录或通过其他方式发现有黑客正在进行攻击时,应立即向信息部相关人员通报情况;B、在信息部人员授权下,立即备份当时的log日志并采用端口限制方式阻断外部的入侵,观察被攻击的服务器等设备状态,同时向信息部领导汇报情况;C、协调相关应用部门,与信息部有关技术人员一同负责被破坏系统的恢复与重建工作;D、协助信息部人员协同有关部门共同追查非法信息来源;E、情况严重的,根据突发事件级别应及时向有关上级部门汇报.2、病毒安全紧急处置措施A、当发现计算机感染有病毒后,应立即将该机从网络上隔离出来;或从网络设备状态发现病毒爆发应采取showmac-addresssharp定位或IP查询将病毒机器所在的网络设备端口shutdown;B、通知维护人员对该设备的硬盘进行数据备份;C、启用杀病毒软件对该机进行杀毒处理,同时进行病毒检测软件对其他机器进行病毒扫描和清除工作;D、如发现杀病毒软件无法清除该病毒,应立即通知用户并向及信息部负责人报告,经信息部技术人员确认无法查杀该病毒并同意格式化硬盘后,作好相关记录,并格式化硬盘;机房应急方案南通工贸技师学院桌面云系统解决方案9E、机器恢复后重新开启网络设备的相应端口;F、认为情况极为严重,根据突发事件级别应及时向有关上级部门汇报。3、广域网线路中断紧急处置措施A、链路出现问题后,网络维护人员应立即信息部负责人报告,沟通地方节点技术人员共同迅速判断故障,查明故障原因;B、如属我方管辖范围,由双方技术人员立即配合予以恢复。如遇无法恢复情况,立即进行备件更换或向有关厂商请求支援;C、如属运营商管辖范围,立即与运营商维护部门申报故障,请求修复;D、根据突发事件级别应及时向有关上级部门汇报。4、局域网中断紧急处置措施A、局域网中断后,网络维护人员应立即判断故障节点,查明故障原因,并向信息部领导汇报;B、如属线路故障,更换新线路或重新安装线路;或从最近飞线至故障设备;C、如属路由器、交换机等网络设备(光模块)故障,应立即查找是否有相关备件可以替换,或与设备提供商联系更换设备,并调试畅通;D、如属路由器、交换机配置文件破坏,应迅速按照备份配置文件重新配置,并调试畅通;如遇无法解决的技术问题,立即向有关厂商请求支援;E、情况严重的,根据突发事件级别应及时向有关上级部门汇报1.6.4网络突发事件记录文档日期故障发生时间线路设备IP现象处理情况故障恢复时间处理工程师备注1.7空调故障处理若空调损坏,应第一时间通知厂家上门进行维修,并及时报告信息部相关领导请示,获得授权后按机房设备关闭顺序关闭各类设备。1.8消防设备故障处理机房应急方案南通工贸技师学院桌面云系统解决方案10一旦机房发生火灾,应遵照下列原则:首先确保人员安全;其次保护关键设备、数据安全;三是保护一般设备安全;人员疏散的程序是:机房工作人员立即按响火警警报,并通过119电话向公安消防请求支援,所有人员戴上防毒面具,所有不参与灭火的人员按照预先确定的线路,迅速从机房中撤出;.人员灭火的程序是:首先切断所有电源,启动自动喷淋系统或使用灭火器,灭火值班人员戴好防毒面具,从指定位置取出泡沫灭火器进行灭火。1.8电源设备故障处理热力机房目前使用UPS系统,在紧急情况发生时,应按如下步骤进行关机:(1)确认所有负载均已安全关机。(2)关闭UPS负载电源。(3)将UPS的系统启用开关切换到off的状态。(4)将DC电池连接断路器切换到off的位置。(5)将所有电池拉出到红色电池断开线以外。(6)断开PDU上的断路器。(7)将PDU后面总输入断路器切换到断开位置。(8)将每个上行主电路断路器切换到断开位置。1.9维护小组成员1.9.1现场服务人员联系方式序
本文标题:机房应急方案20170608
链接地址:https://www.777doc.com/doc-5954650 .html