您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 传输专业设备故障处理指导手册
1传输专业设备故障处理指导手册21.0编制目的为了提高辽宁公司传输专业维护人员对传输设备告警处理的能力、快速定位告警原因、缩短故障处理时长、提高故障处理效率,根据集团网运部关于北方NOC标准化建设的总体要求,以及辽宁省公司公司网运部关于告警处理的各项管理规定,结合实际情况,形成本处理手册。2.0适用范围本手册适用于地市所有波分、SDH等传输设备。3.0传输告警分级分类及派单规则3.1告警分级分类3.1.1告警分级告警级别用于标识一条告警的严重程度和重要性、紧迫性,按严重程度递减的顺序可以将告警分为以下四种:紧急告警、重要告警、次要告警、提示告警。告警级别定义紧急告警带有全局性的、会导致主机瘫痪的故障告警和事件告警。重要告警局部范围内的单板或线路故障告警和事件告警。次要告警一般性的、描述各单板或线路工作是否正常工作的故障告警和事件告警,如单板复位、公用资源申请失败/占用超时等。提示告警提示性故障告警和事件告警。3.1.2告警分类告警类别定义举例3通信告警有关网元通信、ECC通信、光信号通信等的告警。网元通信中断、光信号丢失。处理告警有关软件处理和异常情况的告警。数据库错误、网元处于安装态。设备告警有关设备硬件的告警。激光器故障、光口环回。服务告警有关业务状态和网络服务质量的告警。线路层信号劣化。环境告警有关电源系统、机房环境的告警。电源模块温度过高。安全告警有关网管、网元安全性的告警。网元用户未登录。4.0告警处理基础知识4.1SDH单板常见告警详解4.1.1摘要SDH帧结构中有着丰富的开销字节,借助于这些开销字节传递的告警、性能信息,使得SDH系统具有很强的在线告警和误码监测能力。本段落从数据流向的角度,与单板相结合,详细阐述了各个单板可能出现的告警信息与原因,对维护人员了解告警信息的产生方式与对故障的快速定位有一定帮助意义。4.1.2线路告警指信号流向为SDH接口→交叉板→SDH接口这条路由上的告警信息,也就是在光板上出现的告警。有再生段、复用段与高阶通道开销告警。具体为:(1)LOS信号丢失(截止)从光路上来的STM-N光信号进入光板的光接收模块后,首先经过光电转换后,被恢复成公司号送往帧同步器和扰码器处理。在这过程中,光电转换模块会对该信号进行检测,如果发现输入信号无光、光功率过低4或光功率过高以及输入信号码型不匹配时会上报LOS(信号丢失)告警。发生R-LOS告警时,系统会对下一级电路插入全“1”信号。(2)OOF帧失步报警与LOF帧丢失告警(截止):A1、A2字节用来定位从光/电转换模块发来的STM-N信号,同时从中提取线路参考同步定时源,发送给时钟板进行时钟锁定,正常情况下,A1值恒为F6,A2值恒为28,但如果检测到A1≠F6或A2≠28,将上报OOF告警(帧失步报警)。如果R-OOF告警持续超过3ms,则上报帧丢失告警LOF并下插全1信号。在LOF状态下,若连续1ms以上又处于定帧状态,那么设备又回到正常状态。(3)J0追踪识别符失配告警:定帧后检查J0字节,如果收发两端的J0字节不匹配,则会上告J0追踪识别符失配告警。(4)B1误码:如果从STM-N信号中恢复出的B1字节和接收到的前一个STM-N帧中的BIP-8计算结果不一致,则上报B1误码。以上部分为再生段告警信息。下面介绍复用段告警。这部分主要处理的与告警、性能相关的再生段开销字节有:自动保护倒换通路字节(K1、K2)、复用段误码监视字节(B2)。(5)MS-AIS,MS-RDI告警:如果检测到K2(b6-b8)=111,则上报MS-AIS告警并下插全1信号。如果检测到K2(b6-b8)=110,则上报MS-RDI告警。5(6)B2误码:如果从STM-N信号中恢复出的B2字节和前一个STM-N帧(除再生段开销外的所有比特)的BIP-24计算结果不一致,则上报B2误码。并通过M1字节上报MS-REI告警(注意此告警为回传的告警信息)。下面讲述指针与高阶通道开销告警。这部分主要处理的是高阶指针调整和高阶通道开销,与指针调整有关的字节是H1、H2、H3,而与告警、误码相关的字节有高阶通道追踪字节(J1)、信号标记字节(C2)、高阶通道误码监视字节(B3)、通道状态字节(G1)、复帧位置指示字节(H4)。(注:有的系统高阶通道开销在支路板上处理)(7)AU-AIS管理单元-告警指示信号H1和H2字节全为“1”,则上报AU-AIS告警并下插全“1”信号。(8)AU-LOP(管理单元-指针丢失)如果H1和H2字节代表的指针值非法(不在正常范围0~782内),连续8帧收到非法指针,则上报告警并下插全“1”信号。处理了指针后,光板对高阶通道开销进行处理并产生相应的告警信息。(9)HP-TIM(高阶通道踪迹字节失配):J1字节和预定值不同,则上报HP-TIM告警并下插全“1”信号。(10)高阶通道未装载,高阶通道信号标记失配:如果检测到字节C2=00,则上报HP-UNEQ(高阶通道未装载)告警并下插全1信号。如果检测到C2字节和预定值不同,则上报HP-SLM(高阶通道信号标记失配)告警并下插全1信号。6(11)B3误码:如果从HPOH恢复出的B3字节的计算结果和前一帧VC-4信号的BIP-8计算,结果不一致,则上报B3误码。(12)HP-RDI与HP-REI:如果检测到字节G1(bit5)=1,则上报HP-RDI告警,根据字节G1(bit1-bit4)的取值是否为1-8,判断是否上报HP-REI告警,若是,则上报。(13)LOM(复帧丢失)告警如果检测到H4字节非法,则上报LOM(复帧丢失)告警,并下插全1信号。4.1.3支路告警支路告警主要考虑低阶通道开销告警。业务流向为支路板→交叉板→光板,从交叉板来的VC-4信号送到支路板,然后把VC-4解映射成VC-12。(1)HP-LOM告警:如果检测到H4复帧字节序列错,则上报HP-LOM。(和13相同)(2)TU-AIS、TU-LOP、LP-RDI告警:如果检测到低阶指针字节V1、V2值为全“1”,则上报TU-AIS告警;如果检测到V1、V2值为不合法,则上报TU-LOP告警,发生这两个告警都会往下一功能块插入全“1”信号。此外,如果接收到TU-AIS,除在向下的数据中插入AIS信号以外,同时需要回告LP-RDI,即将V5字节字节的b8比特置为“1”。7(3)低阶通道未装载LP-UNEQ、信号标记失配LP-SLM:检测V5字节的b5-b7比特,作为信号标记上报。如果为000,则表示低阶通道未装载LP-UNEQ,并往下一级电路插入AIS信号。如果信号标记失配,则上报LP-SLM,并往下一级电路插入AIS信号。在V5字节的b8中通道RDI信息将被终结,并上报“远端告警指示”。(4)LPBBE、LPFEBBE:检测V5字节的误码监测比特位b1、b2,对VC-12计算BIP-2。对现行帧计算出来的BIP-2值将与下一帧中恢复出来的V5的b1、b2进行比较,不一致则上报LPBBE。同时,V5字节中的b3比特被恢复出来,如果为“1”,表示检测到远端有BIP-2差错,作为LPFEBBE上报。(5)低阶通道追踪识别符失配告警(LP-TIM):检测收到的J2字节的值和预期收到的值是否相等,若不等,则上报低阶通道追踪识别符失配告警(LP-TIM)。与此同时,还会将低阶通道识别符J2字节恢复出来,并检测收到的J2字节的值和预期收到的值是否相等,若不等,则上报低阶通道追踪识别符失配告警(LP-TIM)。4.2波分系统信号流及常见告警4.2.1波分系统信号流波分复用系统设备可分为光终端复用器(OTM)、光线路放大器(OLA)、光分插复用器(OADM)和电中继器(REG)几种类型。以OTM系统为例,业务信号在系统里的流向如图所示:8图1发送端图2接收端4.2.2波分系统常见告警光波长转换单元(OTU)常见告警告警描述各厂家告警描述产生告警的主要原因缺省告警级别信号丢失烽火:R_LOS、TRIB_RF;华为:R_LOS中兴:信号丢失告警1、线路光纤断;2、线路衰耗过大;3、对端站发送部分故障,线路发送失效紧急帧丢失烽火:RS_LOF、OTN_SDH_LOF;华为:LOF中兴:帧丢失告警1)输入光功率过低或传输过程误码过大2)对端站点发送部分故障紧急9激光器发送失效烽火:OTN_LDOFF、CLIENT_LDOFF;华为:TF中兴:输出无光告警本板激光器故障紧急发送器劣化烽火:EOL华为:TF中兴:激光器寿命告警激光器性能变坏紧急输入功率过低烽火:IOP、;华为:IN_PWR_LOW中兴:输入弱光告警输入光功率过低重要输入功率过高烽火:IOP_HIGH、华为:IN_PWR_HIGH中兴:输入光功率过强告警输入光功率过高重要单板不在位告警烽火:CARD_ABSENT、COMFAIL;华为:BD_STATUS中兴:接口板不在位、单板脱位子架板位槽无单板、单板邮箱故障或单板未插好重要波分复用器:分波/合波器(ODU/OMU)常见告警:告警描述各厂家告警描述产生告警的主要原因缺省告警级别单波长信号丢失烽火:CH_ILOS华为:MUT_LOS中兴:OPM板某个具体通道上报“输入无光告警”1)输出光功率检测电路故障2)线路衰耗过大紧急光放大器(BA/LA/PA)常见告警:告警描述各厂家告警描述产生告警的主要原因缺省告警级别输入功率过低烽火:IOP;华为:IN_PWR_LOW中兴:输入弱光告警输入光功率过低重要输入功率过高烽火:OPM、华为:IN_PWR_HIGH中兴:输出强光告警输出光功率大雨上限;本盘故障;或门限设置不当重要激光器发送失效烽火:LASER_TF、PUMP_TF华为:TF中兴:输出无光告警本板激光器故障紧急光监控信道/通路(OSC)常见告警:10告警描述各厂家告警描述产生告警的主要原因缺省告警级别接收线路侧信号丢失烽火:OSC_LOS华为:R_LOS中兴:输入无光告警1)断纤2)线路衰耗过大3)对端站发送部分故障紧急接收远端告警烽火:OSC_FERF华为:OSC_RDI中兴:信号丢失告警对端站接收到告警信号次要5.0告警处理5.1SDH设备告警处理华为SDH设备告警操作手册:序号网管告警现象产生原因处理办法1R-LOS光路断或用户端设备掉电或故障先确认用户端设备是否掉电,是否为市电断电导致,如均不是,则查询全程光路是否有问题,设备是否存在问题2T-ALOS在哪个机房产生,则故障点即在哪个机房只需确认相应端局是否有人正在施工或做相关操作,否则由相关人员检查设备至配线架之间的整条路由中是否存在问题。3TU-AIS多数会由于对端站出现故障或配置数据不完全造成此告警多数情况下为非本端问题,是由对端故障所引起,首先保证整条传输路由中没有其他告警,其次确认是否有相关人员正在进行配置数据等操作。4R-LOF、R-OOF多数会伴随R-LOS产生,如果不是则有可能是光路衰耗过大所引起以处理R-LOS告警为先,否则检查光路质量是否良好115PS传输环网发生倒换检查是否存在其他紧急告警,如有光路问题,以处理光路问题为主。6BD_STATUS单板不在位确认是否有人正在进行拔插单板或配置业务等操作,否则通知相关专业员处理除上述告警外不常出现的告警,先咨询专业员,在决定是否通知包机责任人。5.2波分设备告警处理波分设备告警处理时,大体需要把握以下三点:1)应严格区分告警来源究竟是客户侧还是波分侧,区别方法总结如下:烽火中兴华为客户侧(接收线路侧)线路2IN/OUTOAC侧CLIENTRx/Tx波分侧(群路侧)线路1Rx/TxOCH侧OCHIN/OUT2)关于激光器自动关断功能:激光器自动关断是在没有光输入的时候,自动关断输出,主要作用是延长激光器寿命,起保护作用。在网运行的设备,只有华为的设备启动了这一功能,即光放站或是OTM站的光放大板如果收不到上游站的光,则该站点不向下游站发光。3)性能事件分析:性能事件是反映设备工作性能的重要参数。性能事件和告警是相关的,当性能事件值超过预先设定的门限时,就会引发相关的告警。了解和掌握性能事件的产生原理、相关单板和相关告警
本文标题:传输专业设备故障处理指导手册
链接地址:https://www.777doc.com/doc-2706711 .html