您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 劳动就业 > 无线维护岗位认证教材_故障处理思路及案例分析
1无线维护篇系列教材之——故障处理思路及案例分析中国电信无线维护岗位认证培训教材2学习完此课程,您将会了解:故障分级制度、故障处理流程;故障处理思路,典型案例分析,等。3故障的分类及定义-1•根据影响通信的范围、持续时间和性质严重程度,一般分为重大通信事故、重大故障、主要故障和一般故障。•重大通信事故范围界定主要根据原信息产业部《关于发布电信运营业重大事故报告规定(试行)的通知》([2002]114号)文件及公司相关规定:移动电话通信阻断超过10万户*小时。4故障的分类及定义-2•重大故障:造成通信大面积中断或计费营帐系统大范围差错,引起大量用户集中投诉,造成重大经济损失或不良社会影响的故障。•主要故障:影响范围较大的系统或关键设备发生通信阻断并达到一定时长,影响用户正常使用的故障。•一般故障:除以上所述的其它故障。5故障的发现•设备告警:声光电告警、维护终端告警信息、机架机框面板上的告警,等。这是最重要最直接的发现故障的途径。•网管统计性能指标:局部区域的性能指标突然恶化。•DT/CQT现场质量测试:局部区域的质量下降。•10000号,用户投诉申告,等。•对端局、或其他运营商的申告,等。6故障处理原则和要求-1•故障处理的首要目标为尽快恢复业务。•各级运行维护部门应遵循“先疏通,后排障;先抢通、后处理”的基本原则。首先判明故障区段、部位,尽快按设备、电路重要程度,“先省际、再省内、后本地”,在优先级较高的重要系统、电路阻断而又无备用、迂回路由可倒换的情况下,可以中断优先级较低的系统和电路,优先抢通优先级较高的重要系统和电路。•遵循“先局内,后局外;先本端,后对端;先交换(无线)后传输;先网内后网外”的原则,按照具体路由接续方式,查清障碍段落。当故障情况涉及多个分公司时,按“故障所在局负责”的原则操作。7故障处理原则和要求-2•在处理故障时,必须对现场各种告警信息、故障显示、故障记录报告等进行认真分析处理,一般应不影响正在通话的用户或任意扩大影响范围,并严格按照各设备厂商提供的故障诊断手册、设备操作手册等规定的命令和操作方法进行处理。•在处理故障时,未经上级运行维护部门同意,不得擅自对交换机、基站控制器、PDSN/FA、AAA(AN-AAA)SERVER、DNS/NTPSERVER、G&C网关等关键设备进行重启,以免造成更大范围的影响。•遵循日常预防维护为主,应急故障处理为辅的管理原则,通过建立故障预警机制,对各种可能引起故障的因素做到“早发现、早处理、早上报”。8故障的业务恢复时限参考时限如下:•重大通信事故和重大故障:应不超过1小时;移动电话通信阻断超过10万户*小时。•主要故障:不超过4小时;•一般故障:不超过1天。•对于无线侧基站等设备故障,应区分设备重要程度等级,可遵循以下参考时限:•重要基站:不超过6小时;•普通基站:不超过24小时。9故障的责任界定•故障的责任追究将遵循“四不放过”的原则:故障原因不查清不放过;故障处理不完成不放过;整改措施不落实不放过;故障教训不汲取不放过。•一般故障,由分公司运行维护部负责对故障进行责任界定。•主要故障、重大故障,由省网运部根据故障的实际状况进行责任界定。必要时,将组成联合调查组赴故障现场进行调查取证。•重大通信事故,由集团会同省分公司相关部门,或经集团授权,由省分公司相关部门组成联合调查组,进行现场调查取证,进行故障责任界定。•经界定因设备原因而引发的严重以上故障,由省网运部会同相关维护责任部门、相关分公司,与设备厂家一起进行故障善后处理。10故障分析制度•各类设备出现故障,都应做好详细的记录,并定期对故障现象和处理情况进行汇总统计。•设备故障记录内容应包括故障现象、故障类型、故障起始时间、故障修复时间、故障历时、故障原因分析、故障处理情况及责任分析、故障处理人等。•汇总统计时应根据故障类型,对各类问题进行汇总。对涉及设备质量方面的问题,应及时向有关部门报告。•对故障进行汇总,按故障产生的原因可分为电源、传输、软件、硬件、局数据设置错误等几类,如相同原因障碍频繁出现,应组织分析并提出解决措施。11故障分析制度•本地网必须将故障分析列入每月通信质量分析例会的主要内容。对一个月来出现的所有故障进行汇总、归类统计,对故障原因进行分析,纳入月度质量分析报告上报省网运部。•对于疑难故障,由省网运部组织支撑专家和设备厂家技术人员进行技术深层次分析,收集相关原始数据、告警信息等,澄清关键技术参数,提出疑难故障的预防措施。12常用故障处理方法•对比法•替换法•排除法•流程图分析法•信令分析法•呼叫观察分析法•详单分析法13对比法比较简单,只要把出故障的数据配置或设备,与正确的设备或数据相比较,找到不同点,进行分析解决问题。常见故障处理方法:对比法14替换法是一种简单实用的故障排除法,对于出现故障的硬件或单板用同样功能(最好是同样型号)正常使用的板件替换掉,如果替换后问题消失了,那就是这个板件的问题。常见故障处理方法:替换法15最小系统法就是去掉系统中的其他硬件设备,只保留最简单的部件,观察最小系统是否有故障。如果有,则可排除其他硬件的问题,而故障来自于现有的几个硬件中。如果没有,则将其他硬件一一添加,查看在添加哪个硬件后出现故障,发现故障所在后,将它更换即可。例如系统中许多重要单板是主备份工作的,在检查问题时可以用一套作为主用,对备用侧进行诊断测试。常见故障处理方法:最小系统法16流程图分析法是对故障相关或经过的软件或硬件用软件流程图或硬件流程图来分析和定位故障,逐个断点,逐段分析。例如对于单通问题的定位,需要逐个检查各级传输设备、各级交换网卡、声码器、甚至终端问题等。常见故障处理方法:流程图分析法17信令分析法是一种在局间局内业务对接、调试中最基本的方法,通过信令分析来确定问题的所在。由于信令有统一的标准性,所以能准确的定位问题。在无线侧主要的信令是七号信令、各种A接口信令、A-BIS接口信令、空口信令。无线设备厂家的网管系统,一般都可以进行信令的监视,但大量的监视有可能造成设备过载。可以使用专门的信令检测仪进行监视、分析。常见故障处理方法:信令分析法18多数无线设备厂家的网管系统可以定义对象进行呼叫观察、或业务观察。对象可以是某些用户、中继接口、或呼叫失败码(原因)等。对每一次失败呼叫都有相应的失败码和失败原因值,通过对失败码的解释就可以方便地定位故障原因。常见故障处理方法:呼叫观察分析法19常见故障处理方法:详单分析法•详单CDL/CDT功能是一种高级的故障分析手段。•CDL:CALLDETAILEDLIST.•CDT:CALLDETAILEDTRACE.•CDL/CDT是一个可以24小时开启,能够跟踪当前接入系统的所有用户的关键性数据,记录每个呼叫的详细信息,数据采集自动、全面、可定制。•CDL/CDT功能,不仅能监视各种接口的信令流程,还可以监视系统设备内部的处理流程及内部资源的占用情况,是全面、高级的流程分析工具。20故障处理知识点的要求•对硬件结构的充分了解。•对各级设备配置、数据设置的充分了解。•对各接口的协议、信令流程的充分了解。•各种仪器仪表的熟练使用。•故障处理经验的积累、交流。21案例1:单通处理-1•单通是指链路建立后,通话双方不能正常进行通话,即其中一方可以听到另一方声音,而另一方听不到声音的现象。按照问题发生的位置可以分为BSS侧单通、传输单通以及MSC侧单通,按照问题产生的局向可以分为局内单通、局间单通。•发生单通的可能原因:1.直放站覆盖区的单通。2.E1/T1物理链路接错引起。3.局间电路问题。两端CIC是否匹配。两端CIC错开,引起单通。4.声码器。5.终端问题。22案例1:单通处理-2•一般情况下,通话过程中出现单通的问题和MSC侧、BSC侧和终端都可能有关系。•在系统侧,根据MSC和BSC系统结构原理,出现单通和串话的原因和以下单板存在关系:声码器单板、后背板和MSC侧的中继接口板、交换网板、模块间的E1中继接口板、A口E1电路等。23案例1:单通处理-3•单通原因-终端问题:•如果某一用户反映单通现象频繁,而该区域其它用户没有出现类似情况,则很可能是终端问题,可以采用更换终端的方法解决。从前方反馈回来的情况看,某些1.9G手机容易出现单通问题,主要原因是手机与基站的协议配合问题。出现单通时,手机上报的几乎全是1/8速率帧,而没有全速率的语音帧。24案例1:单通处理-4•排除单通类的故障,一般需要进行大量呼叫测试,跟踪每次呼叫的资源占用情况:CE,声码器、中继、等,查找规律,定位问题。•单通原因-声码器问题•对于声码器问题的排查,可以通过指定BSC侧声码器进行拨打测试来实现,若存在问题,更换相应的问题单板即可。25案例1:单通处理-5•单通原因-直放站覆盖区的单通由于无线上下行链路的不平衡导致单通,这种现象多出现在直放站覆盖区。对于直放站,有如下关系式:ROT=1+(1/NIM)。其中:ROT(RiseOverThermal)——热噪声增加量;NIM(NoiseInjectionMargin)——注入噪声裕量。可以看出,基站接收机输入端热噪声的增加量ROT决定了直放站反向链路对施主基站反向链路的影响,即NIM值越大,直放站在施主基站接收端引起的噪声增加量ROT越小,反之则越大。而NIM取决于直放站反向链路增益G,G值越大,NIM越小,导致ROT增大,使得施主基站的接收灵敏度降低。此时,处于直放站覆盖区边缘的用户,在接入成功后发生单通的概率增加。此类单通的特点是到所有局向都有可能发生,且具有明显的地域性。26案例1:单通处理-6•单通原因-A口电路问题•A口电路指的BSC与MSC之间的传输电路。A口电路上行或下行链路故障或是中继线连接错位都可能导致单通。由于NO.7信令采用共路信令的工作方式,信令的传送与话路是分开的,因此会出现信令传输正常,而话路不通或者话路单通的现象,通常这类现象是由于中继线路连接错误所引起的。•A口电路问题则比较容易复现,而且只要占用同一条电路就会重现单通现象。在条件许可情况下闭塞部分电路,这将有利于故障重现,由于一般出现问题往往是整个E1故障,也就比较容易定位。需要注意定位故障后应尽快解闭塞的电路,不要长时间影响用户通信。•A口故障单通测试也可以借助BSSAP信令跟踪,当有单通现象时,可以通过AssignReq消息中的CIC来确定A口电路具体位置和BSC所对应的声码器单板。•A口电路出现问题后,单通现象产生的概率很大。假设一个交换局有80条E1和BSC相连,若有一路E1出现问题导致单通,则单通概率将是1/80=1.25%。因此可以通过对产生几率的统计,来判断A口电路是否存在问题。•在找出问题电路后,应该从工程方面入手,仔细检查电路是否存在物理损伤、接头松动或连接错误。如果只是个别时隙存在问题,则应该检查问题时隙的数据配置情况,主要是CIC描述是否一致。27案例1:单通处理-7•单通原因-MSC侧交换网板、FBI光接口板故障•该类型故障的起因是交换网板、FBI光接口板部分HW线故障。判断条件是到所有局向或跨模块出现单通现象。•处理单通问题时,在排除A口电路故障问题后,网板、FBI光接口板将是重点怀疑对象,因为网板、FBI光接口板是到大部分局向的共路部分。可以通过诊断测试工具检测是否存在高误码,也可以通过倒换网板、FBI光接口板检测。28案例1:单通处理-8•单通原因-局间电路问题:•对于有特定局向的单通,我们可以直接着手局间电路的调查。方法与A口问题的排查类似,主要通过拨打测试和话路监听来实现。此外,由于互联互通问题导致的单通也屡见不鲜,对于这一类问题的排查,我们可以使用信令仪,跟踪单通发生时占用电路时隙的编码语音数据帧。若单通方向上电路时隙填充的编码语音数据帧为固定码流,则可以定位互联互通导致了单通的发生。•解决局间电路单通的步骤是:•1.确定单通的局向•2.确定单通的方向•3.确定单通的电路•1)通过动态观察,找出故障电路所在PCM;•2)根据PCM号对电路,即由出现问题的双方先进行自环,以确定本端的2M
本文标题:无线维护岗位认证教材_故障处理思路及案例分析
链接地址:https://www.777doc.com/doc-3175234 .html