您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 电子邮件系统应急预案讲解
电子邮件系统应急预案第一章总则一、目的全面应对通信网络突发事件,确保通信业务安全畅通,提高应对突发事件的综合管理水平和应急处置能力。二、工作原则(一)指导原则统一指挥,分级负责,信息共享,密切协同,快速反应,保障有力。(二)保障原则在“先重点,后一般;先抢通,后抢修”总体原则下。重点保障重点用户、收费用户的使用。(三)编写原则遵循面向业务的原则,具备可操作性,涉及的环节尽量少,启动的时间尽量短。三、编制依据电子邮件系统应急预案制定依据为省公司我部门考核的要求,以及为了确保广大邮箱用户正常使用的基础上制定的。电子邮件系统应急预案备件使用参照《数据网备品备件管理制度》。四、适用范围应急预案适用范围,为辽宁通信公司省网管中心的邮件系统在设备故障、自然灾害及其他突发事件中遭到破坏情况下的应急处置和业务恢复。第二章组织机构和职责一、组织机构为保证通信安全,在通信网络出现阻断或业务疏通能力大幅下降时,能够迅速采取有效保障措施。1、通信保障领导小组姓名单位及职务联系电话组长王朝伟省网管中心经理81818456副组长焦炎省网管中心副经理81818520组员杜文建网络监控部主任818182682、电子邮件系统通信保障实施小组姓名单位及职务联系电话组长候志胜网络监控部基础网维护小组长81818244组员刘欣网络监控部基础网维护小组组员81800127邹明网络监控部基础网维护小组组员81607005王春艳网络监控部基础网维护小组组员81818243二、工作职责应急预案要以应对电子邮件系统突发事件进行响应的全过程为主线,即自突发事件发生、预警开始,到业务保障和设备恢复的全部结束为止,明确每个环节的主办部门与协办部门,明确各部门的职责。各级通信保障实施小组职责负责预案的具体实施,组织抢通、抢修通信设施,并跟踪处理解决结果,及时汇总上报。各级设备维护中心负责组织制定、修改和完善专业设备应急预案,并定期组织预案的演练工作。第三章应急响应一、预警通过对网络设备日常运行数据和网络中业务流量的监测,对全网通信安全造成重要影响的信息进行收集和分析。按照早发现、早处置、早报告的原则,明确影响范围,建立信息传递渠道,落实责任机制,加强监督管理,采取有效措施保障网络安全运行。一般情况下,应逐级报告,遇紧急或特殊情况,准许越级报告,并于报告后逐级补报。二、电子邮件系统的应急响应处置1电子邮件系统的工作流程SMTPPOP3IMAP4WebMailMAPIClientMAPIServerMSSQSendingmaildataRetrievingmaildataControldata1/2634789101112346789101112134598671345UASAuthenticationdata5522AIMC系统工作流程图1.1SMTP的工作流程序号说明1接收到来自Internet的SMTP连接,对本域发件人进行身份验证2完成MessageBlocking操作3对外地收件人,在完成RelayRestriction后加入转发队列4将转发队列中的邮件转发到Internet5对本地收件人,由UAS作身份验证6MTA将待处理的Mail及本地收件人列表传递给MAPIc7MAPIc计算得到每个收件人所属的MSS并选择与之相关的任一MAPIs,将待处理的Mail及本地收件人传送到MAPIs。8MAPIs执行邮件过滤操作,并最终把邮件投递到MSS中9MAPIs从MSS中读写邮箱信息,并得到投递成功/失败结果10MAPIs以投递结果向MAPIc应答11MAPIc在把各MAPIs的投递结果综合起来后传递回MTA。MTA根据结果或者结束该Mail的处理过程,或者向发件人投递失败通知信,或者将邮件加入本地投递队列。1.2WebMail的工作流程序号说明1用户利用Web发送Email2WebMail把待发送Mail及其收件人列表传递给MAPIc3MAPIc调用SMTP发信API完成发信操作4用户利用Web阅读Email5用户登录时,WebMail利用UAS完成身份验证6WebMail向MAPIc传递读信请求,并最终取得信件7MAPIc计算得到用户所属的MSS并选择与之相关的任一MAPIs,将读信请求发送到MAPIs,并最终取得信息8MAPIs从MSS中读出用户的邮件9用户利用Web更改/读取邮箱配置10邮箱配置在WebMail和MAPIc之间传递11MAPIc计算得到用户所属的MSS并选择与之相关的任一MAPIs,与MAPIs交换邮箱配置读写请求12MAPIs从MSS读出邮箱配置信息或向MSS写入邮箱配置信息1.3POP3的工作流程序号说明1用户利用POP3提取Email2用户连接时,POP3利用UAS完成身份验证3POP3向MAPIc传递读信请求,并最终取得信件4MAPIc计算得到用户所属的MSS并选择与之相关的任一MAPIs,将读信请求发送到MAPIs,并最终取得邮件5MAPIs从MSS中提出用户的邮件1.4IMAP4的工作流程序号说明1用户利用IMAP4阅读Email2用户连接时,IMAP4利用UAS完成身份验证3IMAP4向MAPIc传递读信请求,并最终取得信件4MAPIc计算得到用户所属的MSS并选择与之相关的任一MAPIs,将读信请求发送到MAPIs,并最终取得邮件5MAPIs从MSS中读出用户的邮件6用户利用IMAP4更改/读取邮箱Folder配置7邮箱Folder配置在IMAP4和MAPIc之间传递8MAPIc计算得到用户所属的MSS并选择与之相关的任一MAPIs,与MAPIs交换邮箱Folder配置读写请求9MAPIs从MSS读出邮箱Folder配置信息或向MSS写入Folder配置信息2应急预案影响业务的故障点电子邮件系统主要有四种业务:smtp/pop3/imap4/webmail。从系统物理结构分析,四种业务的工作流程都涉及到邮件业务系统、用户认证系统、邮件存储系统、磁盘阵列、网络系统(电子邮件系统物理结构图和配置列表见附件2和附件3),webmail除以上子系统外还涉及到webserver服务器。每个子系统都可能成为影响业务的障碍点。相应的应急预案针对每个障碍点制定了相应的应急预案,并且每个应急预案有相应的启动条件,当满足某个条件时,就启动相应的应急预案。当故障发生后,值班人员首先根据故障现象判断故障点,并启动相应的应急预案;如果无法判断故障点或者不能启动应急预案,要立即通知系统管理员处理。每个障碍点对应的应急预案只适用于本障碍点,不能够屏蔽其他障碍点。各个子系统的应急预案汇总如下:2.1webserver应急预案启动条件当发生下列情况之一,在规定的时间内无法恢复时,启动webserver应急预案:⑴、两台主用webserver由于进程运行异常,页面无法正常显示;⑵、两台主用webserver的页面被篡改;⑶、硬件故障,致使webserver无法启动。判断方法Webserver服务器共有两台,IP地址分别为202.96.74.113和202.96.74.114,端口为2080。故障判断时,应该对这两台服务器分别做检查。例如:检查202.96.74.113这台机器,URL为:2080,查看页面显示是否正常。启动步骤⑴、停掉主用的webserver,启动备用的webserver。启动备用webserver的操作需要5分钟时间。登录mail5.online.ln.cn和mail6.online.ln.cn$cd/opt/aihttpd/bin$./apachectlstop登录mail8.online.ln.cn$cd/opt/aihttpd/bin$./apachectlstart⑵、如果主用webserver的页面被篡改,替换出现问题的webserver的页面文件后,再重启webserver。$cd/opt/aimc$tarxvfwebroot.040430.tar$cd/opt/aihttpd/bin$./apachectlstop$./apachectlstart此项操作如果从备份目录获取页面文件,需要5分钟时间;如果从备份带获取页面文件,需要10分钟时间。注意事项⑴、在日常维护中,应当定期检查备用webserver的可用性,并检查备份带和磁带机的可用性,定期更新备份文件和备份带。⑵、在网络小组的协助下,通过apacheserver的事务日志和系统登录日志查找攻击源,及时在前端路由器上进行封堵。⑶、主用的webserver服务器在南机房20、21机柜上,机器名称为mail5.online.ln.cn、mail6.online.ln.cn。备份文件存放在mss1存储服务器/home1/backup。撤销条件当出现故障的webserver恢复时,将备用的webserver停掉,并启动已经恢复的webserver。登录mail5.online.ln.cn和mail6.online.ln.cn$cd/opt/aihttpd/bin$./apachectlstart登录mail8.online.ln.cn$cd/opt/aihttpd/bin$./apachectlstop2.2用户认证系统应急预案启动条件当发生下列情况之一,在规定的时间内无法恢复时,启动用户认证系统应急预案:⑴、aiuum进程运行异常;⑵、aiuum无法连接oracle数据库,或者无法读取数据库的aiuum数据字典;⑶、oracle数据库运行异常;⑷、uas0、uas1服务器硬件故障,致使服务器无法启动。判断方法⑴、很多用户通过客户端软件(outlook、foxmail)或者webmail方式收发邮件时频繁提示“密码不对”或者“你没有访问此邮箱的权限!”,可以断定是用户认证服务器的问题。⑵、在uas0、uas1上运行如下命令:/opt/aiuum/bin/ServicePoolmonitor查看aiuum服务进程组的运行信息。如果运行信息中的“CurrentProcessCount=0”,表明连接数据库失败,或者无法读取数据库的AIUUM数据字典。启动步骤⑴、在前台业务服务器上修改aimc.ini配置文件,将下面红色字体修改为Server1=910.1.32.3888910[UAPI];Backend:1-LDAP,2-RADIUS,4-System,8-Oracle,16-OCS,128+-WANServer0=00.0.0.000;thebackend,ip/connect_string,portandrateofthecertifyserversServer1=910.1.32.188891010.1.32.2888910Server2=00.0.0.000⑵、重启aimc进程cd/opt/aimc./aimc_stop./aimc_start注意事项⑴、启用备用认证数据库后,用户信息将不能进行增、删、改操作,但不影响用户认证。⑵、此项操作需要修改10台业务服务器的配置,每台服务器需要2分钟时间,总共需要20分钟时间。这项操作的最佳配置为2个人,分别负责5台业务服务器,这样共需要10分钟时间。撤销条件当uas0、uas1的数据库恢复正常时,可以将前端业务服务器上的aimc.ini配置文件改回,重启aimc进程并进行测试。2.3邮件存储系统应急预案采用1台SUNE6500和2台SUNE3500组成邮件存储服务器群,实现MSS(MailStorageSystem)功能。3台MSS之间通过软件进行负载分担。服务器上配置了VeritasFileSystem、VeritasVolumeManager软件,提高了文件访问的效率,同时,配置了VeritasClusterServer软件进行负载分担和互为备份:任何一台服务器出现故障其他服务器都可以马上接替其工作,配置了一台HUB配合负载分担的切换工作。3台存储服务器都采用双千兆网卡与Catalyst4006连接,每台服务器上的两块网卡都同时工作,绑定1个IP,平时一块网卡作为备用网卡,当主网卡出现问题或者网线出
本文标题:电子邮件系统应急预案讲解
链接地址:https://www.777doc.com/doc-7232995 .html