您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 传输故障排除案例集锦(HUAWEI)
OptiX光传输系统故障排除案例集锦11业务中断的处理1.1更换光板类型错误导致对端收光不正常【系统概述】某传输组网如图1所示,4个OptiX2500+设备组成双向复用段保护环;1号站为业务中心点,连接网管。其中,3号站和2号站之间距离较长,使用了BPA光放板。1wMSPOptiX2500+234eeee系统组网图【故障现象】某日机房维护人员发现2号站接收3号站方向的S16有R-LOS告警,全网正常倒换,业务未受影响,用网管查询2号站的告警,PA有IP-FAIL(无输入光)告警,3号站的BA有IP-FAIL告警。【故障分析及排除】BPA板光口1对应的是BA(功放,将S16的输出光信号放大14或17dBm);光口2为PA(前放,当输入光功率在-22dBm~-32dBm之间时,光口OUT2输出光功率变化范围在-7dBm~-21dBm)。光信号经过BPA的尾纤连接及信号流向如图2所示:OptiX光传输系统故障排除案例集锦2INOUTINS16BAPAS16OUTOUTIN3号站2号站图2BPA光信号流向(1)根据光信号经过BPA的信号流可以看出,由于3号站光放板的BA未收到光信号,导致了2号站的PA、S16报收无光。可以判断故障点在3号站;(2)维护人员带S16、BPA、尾纤、光功率计到3号站;(3)在3号站测试S16板的输出光功率值,光功率计显示无光信号。可以判断是S16板故障;(4)将带的S16板插上,测试S16输出光功率为0dBm,恢复尾纤连接;(5)BA板告警消失,但S16仍有红灯一闪告警,查询为MS-RDI;(6)查询2号站S16,仍有R-LOS告警;(7)在3号站,将换上去的S16板发光功率衰减到-15dBm做自环,告警消失。判断新换上去的S16并没有损坏;(8)为什么仍有告警呢?分析原因是3号站的S16板使用有错,SS62S1605与SS62S1604波长是一样的,而色散受限距离不同,可能是色散过大导致对端收光不正常。(9)查看3号站原来使用的S16的光板类型,为SS62S1605;刚换上去的S16类型为SS62S1604;(10)更换同类型的S16,故障消除。OptiX光传输系统故障排除案例集锦3【结论和建议】光板种类较多,更换光板时要考虑换上去的光板型号是否正确。如果短距光板用在长距上会出现性能不够,而长距光板用在短距上可能会出现收光过载,长期工作易损坏收光模块,并形成浪费。在换板的时候可以比较一下两块光板的类型。与PA板配合的2.5G光发送板统计如下(如有变更,请咨询华为公司):设备类型光板类型SBS2500SS33T1602SBS2500/OptiXREGSS31L1605SBS2500/OptiXREGSS32L1610OptiX2500+SS62S1605OptiX光传输系统故障排除案例集锦41.2GTC板故障导致业务中断【系统概述】某工程组网如图3所示,4个OptiX155/622设备组成622M单向通道保护环,为集中型业务,1号站为中心点,连接网管。1wPPOptiX155/622234eeee系统组网图【故障现象】某日交换机房维护人员反映到3号站的业务中断。查询传输网管告警和性能事件,对应的支路并没有告警和误码、不可用秒等性能事件。用网管对3号站支路通道做内环回,1号站用误码仪测试,仪表显示业务不通。1号站做外环回,仪表显示业务正常。【故障分析及排除】(1)对应通道没有异常告警和性能事件,一般情况下业务应该是正常的。考虑到部分告警主机缺省是屏蔽的,是不是告警被屏蔽了呢?用网管将1号和3号站支路板的告警屏蔽全取消,查询1号站仍没有异常的告警和性能事件,而3号站通道有LP-UNEQ(支路未装载)告警;(2)分析1号站业务,1号站同一块PD1不仅有到3号站的业务,还有到2号站的业务,而且在相同的VC-4中,如果是1号站PD1、GTC、SL4故障,一般不会只影响到3号站的业务。OptiX光传输系统故障排除案例集锦5可以初步排除1号站有故障的可能;(如果允许,可以做VC-4环回进行测试)(3)由于只有3号站的业务不好,而同一VC-4中1号站到2号站的业务是好的,故障点最可能在3号站;也可能是2号站的交叉板,怀疑2号站业务穿通不好的原因是,3号站收1号站有LP-UNEQ告警,说明1号站发往3号站的业务有故障,而3号站收1号站只经过了2号站的穿通。(4)将1号站对2号站的激光器关闭,倒换后,其它站点业务正常,仍然只有3号站业务不好,告警一样。可以排除2号站穿通不好。(也可以先不对穿通站进行故障定位)(5)分析3号站业务,3号站只有1块PD1,且业务只对1号站。由于同一VC-4中的1号站到2号站的穿通业务正常,可以初步排除3号站SL4板不好。怀疑是3号站GTC或PD1故障。(6)带GTC、PD1到3号站。先更换PD1故障未消失,更换GTC业务恢复。【结论和建议】由于GTC和支路板位的接口部分不好,导致了故障。在故障处理中,根据告警,分析业务配置情况、根据业务流向,可有效的进行故障定位。OptiX光传输系统故障排除案例集锦61.3接收端有光功率但R16报R-LOS的故障处理【系统概述】某工程组网如图4所示,4个SBS2500设备组成双向复用段保护环,1号站为中心点,连接网管。1wMSPSBS2500234eeee系统组网图【故障现象】某日,机房维护人员发现3号站接收4号站方向的R16板有R-LOS告警,4号站相对应的光板有MS-RDI,复用段进行了保护倒换,业务未受到影响。【故障分析及排除】(1)由于3号站和4号站之间只有一个方向有问题,断纤的可能性不是很大,故维护人员先带上R16、T16、光功率计、两根测试尾纤、光衰减器、无水酒精和棉球到3号站进行处理;(2)在3号站,测量对4号站方向的收光功率为-21dBm,在长距R16板的接收范围内,排除了光缆不好的可能;(3)将两根测试尾纤用光衰减器相连,尾纤一端与T16相连,另一端与光功率计相连,调节光衰减器,直到光功率在-22dBm左右,将尾纤从光功率计移到R16上,进行自环测试,观察到R16板告警消失,ASP没有R-LOS、R-LOF告警。可以OptiX光传输系统故障排除案例集锦7判断3号站正常,而且没有因为R16内部的法兰盘接触不好或变脏影响灵敏度,可以排除3号站故障。(4)在4号站,对T16做自环测试(注意R16收光功率应小于过载点-9dBm),发现R16有三闪告警,为RLOS告警。可以判断是T16故障。(5)更换上相同类型的T16,故障解决。【结论和建议】SBS2500设备,2.5G光板有R16、T16、ASP组成。如果T16输出光信号上没有数据或时钟信号,可导致对端R16上报RLOS告警;A1、A2字节由ASP板处理(本端生成、对端计算),如果设备有RLOF告警,可能是ASP板故障导致。OptiX光传输系统故障排除案例集锦81.4时钟板性能不好导致业务异常【系统概述】某工程组网如图5所示,4个OptiX155/622设备组成155M单向复用段保护环,为集中型业务,1号站为中心点,连接网管。1号站为内置时钟,其它站西向跟踪。1wuni-mspOptiX155M2354eeee系统组网图【故障现象】某日传输机房维护人员反映环上的业务时断时好。查询1号站的告警,发现通道每隔几十分钟就有TU-AIS告警,1号站和3号站对应4号站的SL1光板有B2SD告警,各站GTC板有PS复用段倒换告警。【故障分析及排除】(1)可以判断是1号站西侧、3号站东侧光路出现B2SD,引起了通道误码、单向复用段保护倒换影响了业务。由于单向复用段倒换会涉及到环上的所有业务,而倒换前通道出现的误码、倒换将引起基站业务重启,主机缺省关闭了将B2SD、B2OVER作为复用段倒换条件。(2)4号站两侧站点的光板同时出现了B2SD,可以定位是4号站的问题。OptiX155/622网元由时钟板给单板提供时钟信号,可以初步判断是由于时钟板性能不好,导致不同站时钟相差大,引起光路出现误码;OptiX光传输系统故障排除案例集锦9(3)更换4号站的时钟板进行观察,故障未重现。【结论和建议】时钟板的提供的质量稳定性将影响站上各单板信号的质量,时钟质量下降与本站时钟板质量不好有关,有时也与所跟踪站的时钟板的时钟质量不好有关。通常时钟质量不好,时钟板会上报SYN-BAD(时钟劣化)告警。SYN-BAD告警的含义是时钟板本身时钟质量与当前所跟踪的参考源时钟质量相比较,这两个时钟之间的精度差异超过设定的阈值,单板上报SYN-BAD告警。出现SYN-BAD告警有两种可能性:(1)上报SYN-BAD站的时钟板性能不好;(2)所跟踪源(时钟跟踪的上游站点)的时钟质量不好。在日常维护时,通过查询时钟板有没有SYN-BAD告警和有没有指针调整或误码性能事件,可以预见故障,及时的处理可以防止故障的发生。OptiX光传输系统故障排除案例集锦101.5支路板报T-LOTC告警影响业务【系统概述】某工程组网如图6所示,由1、2、3、4号站组成通道保护环。为集中型业务,1号站为中心点,网管在1号站。1wPPOptiX155M234eeee系统组网图【故障现象】某日环上断纤,设备倒换后,维护人员发现3号网元SS12PL1有部分使用的通道报T-LOTC告警。询问交换机房反映业务不通。【故障分析及排除】(1)引起T-LOTC告警的原因可能就是导致这些通道业务不通的原因,T-LOTC是指支路发送时钟丢失。(2)T-LOTC告警是在解映射之后出现的告警。支路板信号流程如图7示:OptiX光传输系统故障排除案例集锦11HDB3解码器HDB3编码器映射解映射120欧或75欧接收120欧或75欧发送去交叉板自交叉板支路板交叉板图7支路信号流程框图(3)从支路信号流程图分析,支路通道出现T-LOTC告警的原因可能是3号站SS12PL1支路板本身故障导致,可更换该板;(4)也有可能是上游传送过来信号有问题(V5字节不正确),即与对端站的支路板(更换支路板可解决)或该业务经过的路由有关(需要排除两端站及穿通站的故障);(5)根据以上分析,先更换3号站的SS12PL1,故障消除。【结论和建议】支路板故障导致了业务受到影响。支路板有T-LOTC告警,可用网管复位本站或对端站的支路板看能否先恢复业务,再更换单板以减少业务中断的时间;如果是支路板某一通道的问题,可以更改通道;如果其它问题,可以考虑更改业务经过的时隙。OptiX光传输系统故障排除案例集锦121.6光缆维修后超长距光板报R-LOS告警【系统概述】某工程组网如图8所示,由1、2、3号站组成一条链。为集中型业务,1号站为中心点,网管在1号站。其中2号站和3号站之间距离较长,使用了SS24SL4的超长距光板。12155M链3图8系统组网图【故障现象】某日,机房维护人员发现3号站的SS24SL4板上报R-LOS告警。【故障分析及排除】(1)在3号站测试,收光功率正常。将3号站SS24SL4光信号经过衰减后自环,发现光板告警灯3闪,为R-LOS告警,判断3号站光板故障;(2)更换3号站光板后业务恢复正常;(3)经了解该段光缆前一段时间重新割接过,因为超长距SS24SL4板使用了APD收光模块,故推测可能该板曾注入过强光,通过调查,光缆维修时曾在2号站用OTDR对3号站进行过测试;(4)该光板经返回华为公司检修分析,的确是光模块损坏。OptiX光传输系统故障排除案例集锦13【结论和建议】长距光板(包括2.5G)接收器件利用APD(高增益的雪崩光电探测二极管)实现光电转换,由于光接收器件的高增益性,使得接收机的灵敏度得到很大提高,但是另一方面,在接收光功率很大的环境下,雪崩光电二极管的工作电流也会相应增大,如果工作在大电流的条件下,APD的失效率也会增加,导致雪崩二极管失效烧毁。APD的收光功率峰值过高,可能会导致O/E变化器和光连接器端面的损坏。而用于测试光缆的OTDR发出的光信号虽然是连续短脉冲,但峰值功率通常很强,如果没有经过足够的衰减,很容易超过APD
本文标题:传输故障排除案例集锦(HUAWEI)
链接地址:https://www.777doc.com/doc-7516681 .html