您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 移动交换网应急通信保障探讨
移动交换网应急通信保障探讨董伟宏(中国联通佛山分公司网络维护中心邮编:528000)【摘要】文章介绍移动交换网应急保障的基本概念与基本情况,并结合运维事件,提出了应急保障的一些思路与手段。【关键词】移动交换网应急保障1应急通信保障概念的提出随着通信技术的发展,通信的内涵不断丰富,已经成为人们联络感情、交换信息的生活必需工具和方式。尤其是近年来不断发展,人们的日常生活中已经越来越离不开电话、手机、互联网等通信工具。因此,一旦通信网络发生故障,都会给许多人造成工作和生活上的极大不便,有时还会引起社会混乱,甚至会危及到国家安全,造成严重的后果。因此,在关键时刻(如重要节假日、飓风、洪水、地震、瘟疫乃至战争等)如何保持国家、政府、企业、组织和个人之间的通信,已经引起了包括各大运营商在内越来越多人们的关注。全世界各大通信运营商都已经将应急通信保障列入了运维工作的重点序列。2移动交换网应急保障概况2.1移动交换网在移动通信网络中的重要地位在现代移动通信网络中,移动交换网承担着移动用户数据管理、无线网络接入、呼叫处理控制、智能与增值业务支持、互联互通等重要任务。因此,我们经常称之为通信系统的“核心网络”。2.2移动交换网应急状态的分级l战备状态、防灾抗灾、以及不可抗拒的自然力破坏;l突发的重大故障造成的瘫崩或业务全阻;l突发重大社会事件造成的全网遭受大话务冲击;l可预测的重大节日、会议、活动引起的局部地区、局部时间内的大话务冲击。2.3移动交换网应急保障的要点对于移动交换网,我们经常用话务量、CPU占有率、BHCA值、资源占有率等性能值来评价系统负荷。l系统(交换主处理机)负荷:在电子交换机时代,基本上每种类型的交换机都一套主处理机。由主处理机来控制全局资源的分配,或者完成主要的呼叫处理工作。作为处理机而言,系统负荷是首要的;只要处理机不崩溃,各项子系统工作就能保持基本运行。l交换模块负荷:目前许多的交换机都采取了负荷分担的组成模式;但是由于不同的交换模块承载的业务量、业务类型不尽相同。当出现局部地区、局部业务突然话务猛增的时候,某模块的负荷就可能剧增。l话务疏导与限流:交换机话务控制可以分为两类:首先是话务疏导,当出现局部局向话务拥塞时,可以采取分流的方式向其他较闲的局向疏导;其次是话务限流,当交换负荷居高不下,系统资源匮乏时,应该采取果断的限流措施。以最快的速度有效减少呼叫处理量,达到迅速降低负荷的目的。3.移动交换网应急保障的思路与手段3.1交换处理机负荷的控制核心网内各类业务类型的交换机担当角色不同,系统组成也不尽相同,因此,关于负荷的控制需要从详细分析其各类子系统组成、业务类型入手。譬如GSMMSC、综合关口局、短信中心,在业务承载上就有很大的不同。3.1.1深入了解系统组成,定位关键负荷:以朗讯CDMA交换系统为例,主要呼叫处理(呼叫控制、路由分析、业务生成等)由ECP部分完成,其关键负荷时CDN(呼叫处理器)的负荷;而电路交换(T-S-T)、基站接入部分则由5ESS完成,其关键负荷时各个交换模块(SM)的负荷。此外,联接基站处理服务器(AP)、信令节点、CDN节点的IMS环路的负荷也需要考虑。而西门子GSM交换机为例,主要考察的是交换机CP负荷,CP负荷是各项资源指标的综合反应。3.1.2分析业务类型、业务组成,了解负荷组成:由于现代的移动交换机已经不仅仅提供话音服务,同时提供象短消息、WAP以及数据业务。用户类型也包括普通用户、预付费用户、智能网用户等多种类型。每种业务、用户类型对交换资源(信令、处理量)的需求也是不一致的。通常智能业务往往需要耗费更多的资源。因此,我们还需要详细分析每种业务类型、业务量对交换资源的占用情况。以便在紧急情况下,采取有效的措施:例如,目前G网华为局PPS号段被叫的触发数据,在西门子和华为交换局中继负荷较高时实施,可以将PPS被叫触发数据取消,由西门子直接完成呼叫。可以有效减轻中继负荷。又如,短信中心可以通过对群发业务SP实现限制或者闭锁,保证点对点短信的畅通。3.1.3充分发挥无线网络的调控手段,有效控制负荷增长:对于移动交换网而言,最主要的话务是来源于手机用户的呼叫。因此,在交换网络出现负荷告警时,可以先在基站侧闭掉短信功能;更紧急情况下,通过预先准备好的基站闭锁批处理命令,快速减少呼叫处理、话务负荷,帮助交换系统安全“闯关”。3.2交换系统的话务疏导与限流移动交换系统的话务应急大致可以分为两类,一类是局部业务、用户行为造成的某些局向业务拥塞;另一类是由于突发性的事件,造成全网、全业务的极大话务冲击。3.2.1话务疏导首先对于局部话务,我们通常采取疏导的方式保证某些繁忙阶段的网络接通率等。要达到这一目的,我们需要:l了解全程全网交换网络结构,了解网内、网间各交换局的局情(系统负荷、互联中继负荷)等等情况。只有充分做好了调查,才能作为话务疏导的可行方案;l做好备份(冗余)路由数据:这类数据包括中断备份、溢出备份数据等;由于临时局间话务的转接,需要双方交换机作好去、来话等许多临时的路由分析数据,稍有不慎,将可能导致“乒乓”话务,带来灾难性后果。因此,备份路由需要实现经过双方交换局协商,共同制定路由方案、号码传递方案、还需要附加考虑计费、互联互通结算等情况。备份路由事先应该通过实际呼叫测试。l对于应急时临时疏导的话务,在应急结束时,应该及时予以恢复。3.2.2话务限流对于突发社会、自然事件造成极大话务冲击,我们可以预先配置交换机自带的呼叫处理限制功能。一般来说,出现极大话务量是属于突发性质的。极大话务量往往造成系统CPU占用率偏高,而大话务的瞬间冲击又易造成系统不可预测的故障后果。所以在极大话务量情况下,需要通过一些特殊的维护手段将系统故障损失降至最小,从而避免全模块甚至全局系统的崩溃。l交换机限流,以华为GSM交换局为例:首先各个业务处理模块(SPM)会上报告警,可以在告警台上通过查询告警信息得到系统过载的情况;系统具有自动限呼功能。如果CPU过载达到一级(即CPU占用率达到其阈值),限呼25%的呼叫,达到二级,限呼50%的呼叫,达到三级,限呼75%的呼叫,达到四级,对所有呼叫进行限呼。系统过载及拥塞阈值的默认值分别为:过载开始88%、过载结束84%;拥塞开始94%、拥塞结束91%。建议对话务量较大的模块或局在大话务量到来之前修改其过载及拥塞阈值分别为:80%、60%、90%、70%,利用主机程序的保护机制提前限呼部分用户的呼叫,避免严重后果的发生。l限制局间话务对于移动交换系统,除了无线话务控制外,还可以采取互联局间话务控制手段。例如,通过《网间通信预案》,关键时候可以请其他运营上进行话务比例调整、话务限制等手段,有效降低话务增长。3.3快速反应、有条不紊完成交换机热、冷启动在极大话务冲击导致系统宕机,或者电力中断恢复后,我们需要准确分析交换机情况,选择正确的系统启动方式,迅速完成系统启动,完成业务恢复。一般而言,在系统操作终端、各网元设备供电正常情况下,我们可以迅速通过“热启动”将系统恢复。特殊情况,如果系统数据损坏,我们可以通过备份硬盘、备份磁带将系统恢复。4未雨绸缪,完善应急保障机制对于应急通信保障,以上大都是对“事中”、“事后”的过程进行了探讨,而实际上,未雨绸缪,防范于未燃,提高系统的容灾、抗灾能力也是我们追求的目标。4.1应急通信贯穿网络建设和流程管理的设计、执行过程例如,在网络建设阶段,我们需要从局方动力环境、交换网元配置、传输配置、业务配置等等方面对网络的安全性、容灾性进行充分评估;在网络业务加载阶段,需要考虑平衡模块、网元负荷;在网络调整与优化工作中,除了系统性能、指标的优化,更需要考虑系统负荷的均衡、新业务的负荷评估、结构改造等等。4.2应急预案的定期更新、应急措施的定期演练由于网络结构、设备变化等因素,应该定期更新应急预案的内容。对于一个优秀的运营级应急维护团队而言,还必须定期按照预案内容进行模拟突发事件发生时刻的应急抢险演练,如应对火灾、设备故障、网络瘫痪等。通过应急演练,才能够充分反应应急保障的实际能力、锻炼队伍、检验应急措施。4.3深入分析话务成分、用户行为并加强对影响话务的社会活动关注通过深入分析话务成分,总结用户行为,我们能够更准确把握业务发展对系统的影响,从而做好扩容、调整措施。此外,关注可能导致话务增长的社会活动,才能有效做好各项区域、时段的应急准备。4.4积极跟踪国外运营商应急通信技术动态一些西方发达国家中,已经将应急通信保障纳入了运营商的基本要求,有的甚至通过立法来强制实施。尤其在“9.11”事件之后,美国与西方各国移动运营商都花大力气在应急系统建设等方面加大投入。在用户的接入分级方面,欧美国家开始对用户实行严格分级:即移动网内所有用户并非享有平等的系统接入权限;一些国家安全机关、军警等重要部门具有高于普通用户的接入权力,在无线网络拥塞是,将首先保证这些用户的使用。例如,在05年7月8日的伦敦连环爆炸中,由于伦敦市的居民蜂拥打电话给自己的朋友与家人,英国的主要移动通讯网络一度吃紧。沃达丰伦敦公司的交换机处于容量高峰(极少出现的情况),因此,他们不得不启动过载应急程序,将优先保证警察与紧急服务机构的通讯连络。
本文标题:移动交换网应急通信保障探讨
链接地址:https://www.777doc.com/doc-4953916 .html