您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > NG WDM产品网元间通信专题-20110411-A
HUAWEITECHNOLOGIESCo.,Ltd.网元内通信专题HUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidential培训目的本胶片针对OSN8800&6800&3800产品网元内部通信机制进行了介绍。并为该机制相关原理、操作、告警及常见案例进行分析,总结了部分开局、维护过程中出现过的经典案例,供后期维护、用服人员参考。目录•相关必备知识•板间通信原理解读•板间通信端口作用解读•板间通信相关告警解读•处理板间通信故障•典型故障案例HUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidential相关必备知识1、掌握OSN8800&6800&3800设备接口结构及其作用--熟知各设备接口作用,了解其所承载的信息,知道各端口间备份关系,对端口之间级联规则准确掌握,能了解级联不规范时的影响。2、掌握OSN8800&6800主从子架概念--熟知主从子架规格要求,了解主从子架构成的网元跟传统网元的区别。对主从子架形态、开局安装、网管口网线连接、子架间网线级联以及主从子架更改原则熟练掌握。3、掌握板间通信告警含义--熟知告警各参数指示的含义。Page4HUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidential板间通信原理解读--通信物理连接图Page56800通信物理连接如图所示:1)子架内主控板和单板之间通过485通道进行紧急消息的传递。2)跨子架单板和主子架上主控板之间紧急消息传递,是通过子架内485通道和子架间紧急以太网通道共同配合完成传递。3)子架间紧急以太网通道也包括子架内和子架间两部分:子架内部分如上图中SCC和AUX之间的红色线条,该紧急以太网通道在子架背板上;子架间部分如上图中两个子架AUX之间红色线条,通过子架间级联网线8根芯中的4根芯实现(第4,5,7,8芯)。4)子架间普通ETH通道相当于子架内普通ETH通道的扩展,是跨子架单板和主子架主控板普通消息传递的桥梁。子架间普通ETH通道如上图中两个子架AUX之间蓝色线条,通过子架间级联网线8根芯中的4根芯实现。(第1,2,3,6芯)HUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidential板间通信原理解读--通信物理连接图Page68800通信物理连接如图所示:HUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidential板间通信端口作用解读1、管理通道用于连接网管,是网管管理设备的端口。也可用于多个网元之间级联,多个网元之间级联时,只能级联网管口,此时,每个网元上的网管口就都相当于一个2端口交换机。网管口不可以和子架的内网口(ETH1/ETH2/ETH3)级联。备注:通过网管口将多个NGWDM网元级联,等价于把多个NGWDM网元都接到一个多口的HUB上。但是请注意:使用ASON时,推荐采用主从模式(主从子架引入的原始原因是因为ASON需要将所有光层单板纳入一个网元管理;所以有ASON功能时推荐采用主从子架模式)。2、板间及子架间通信普通通道主控板和单板之间普通ETH通信的端口。8800&6800因为有主从子架,因此有子架间的普通ETH通道,子架间普通ETH通道相当于子架内普通ETH通道的扩展。3、板间及子架间通信紧急通道子架内紧急通道的物理通道是485总线,子架间紧急通道的物理通道是子架间级联的紧急ETH通道。从子架单板和主子架主控板之间的紧急消息需要从子架主控板进行转发。同一个网元内部子架之间级联时,用的是设备接口的内网口,对于ETH1/ETH2/ETH3来说,其三个的功能是等价的。Page7HUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidential板间通信相关告警解读-(1)1、SUBRACK_LOOP子架连接成环告警。当同一个网元内部主从子架间内网口连接成环时,上报该告警。该告警出现时,该网元内部所有ETH通信都可能已受到影响,会导致一系列跟通信相关的异常现象出现。解决措施是现场仔细排查网线连接情况,找到环路点并清除。2、SUBRACK_ID_CONFLICT子架连接冲突告警。当同一个网元内部级联了两个及两个以上子架ID一样的子架时,上报该告警。该告警出现时,子架ID冲突的子架上所有ETH通信都可能已受到影响。若主子架ID冲突,可能导致配置及单板上报事件丢失的情况。解决措施是确认冲突的子架ID,对子架重新拨码,并对主控和单板进行复位。如果已经影响了配置,则需要重新进行配置。HUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidential板间通信相关告警解读-(2)3、SUBRACK_ID_MISMATCH子架ID不匹配告警。同一个子架上,AUX当前的子架ID拨码,跟主控板上使用的子架ID不一致(往往是AUX重新进行了拨码但没有对单板进行复位导致)。该告警出现时,若该子架上有单板复位,则单板复位起来后,将和主子架主控板不能通信。解决措施是确认AUX当前的子架ID拨码是否正确,若AUX拨码不正确,则对AUX进行重新拨码;若AUX拨码正确,则根据需要对该子架上所有单板复位,或者对子架掉电解决。4、COMMUN_FAIL通信失效告警。参数为0x010x000x01时,表示RS485的1号通道失效;参数为0x010x000x02时,表示RS485的2号通道失效。参数为0x010x000x03时,表示板间ETH通信失效。参数为0x010x000x04时,表示子架间紧急ETH通信失效。在8800上,参数为0x010x000x06时,表示RS485的3号通道失效;参数为0x010x000x07时,表示RS485的4号通道失效。当两路485通道都失效时,可能会影响保护倒换时间。板间ETH通信失效,会导致配置信息无法下发,告警性能无法上报。子架间紧急ETH通信失效,影响从子架上保护倒换。解决措施是更换网线或者单板。HUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidentialCOMMUN_FAIL告警参数解读Page10HUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidentialPage11从子架主控上报COMM_FAIL告警,常见参数是para[2]=0x04,即紧急以太网故障。此告警会导致在从子架上的保护组无法上报SF/SD事件等紧急以太网消息。单板上报COMM_FAIL告警,常见参数是para[2]=0x03,即普通以太网故障。此告警会导致单板无法上线。6800&8800产品由于有多子架,上电时拨码和子架间级联网线连接错误导致上报子架ID冲突SUBRACK_ID_CONFLICT和成环告警SUBRACK_LOOP。同一个子架上,AUX当前的子架ID拨码,跟主控板上使用的子架ID不一致时,会上报子架ID不匹配告警SUBRACK_ID_MISMATCH。1234故障现象及对系统的影响处理板间通信故障HUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidential处理板间通信故障--定位步骤•1.确认网元上是否存在拨码冲突和子架成环告警•2.检查子架更换拨码后,是否未对单板进行复位•3.根据COMMUN_FAIL告警上报参数确定以太网故障类型,根据故障类型分别采取不同的定位方法。无论是普通以太网还是紧急以太网故障,子架间级联网线不好都有可能会导致以太网故障,因此遇到COMMUN_FAIL等告警问题时,可以首先替换子架间级联的网线是否是好的,以及子架间网线连接是否正确。如果判断网线连接没有问题之后采取其他步骤定位。Page12TipHUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidential处理板间通信故障--定位步骤根据COMMUN_FAIL告警上报参数进行故障判断和处理的方法如下:•1、如果是普通以太网故障,首先确认AUX单板是否有故障。•2、普通以太网故障情况下,确认AUX单板无故障之后,继续确认上报告警的单板是否存在故障。•3、如果是紧急以太网故障,紧急以太网和单板是无关的,只可能与网线、主控板以及AUX单板有关系。•4、如果是485通信故障,更换上报485通信故障的单板,如果故障仍然无法解决,联系研发处理。Page13HUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidential处理板间通信故障•网元通信故障告警上报原理和处理方法,告警参数信息可参考用户手册《告警和性能事件处理》。•网元内通信相关原理和故障处理具体操作步骤和案例,可参考专题文档《NGWDM网元内通信专题》和《NGWDM网元内以太网故障维护专题》。本节以典型案例为例介绍网元内通信故障定位和排查的方法和步骤。Page14HUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidential处理板间通信故障-典型故障案例由于网线问题导致OSN6800上报COMMUN_FAIL告警【故障现象】:某工程中扩容一个OSN6800子架,放置在新的机柜中,需要现场制作网线把新机柜子架和老机柜子架之间的通信连接起来。完成扩容后从子架能正常登陆通,但新扩的子架主控板上报COMMUN_FAIL告警,告警参数0x000x04,SCC单板指示灯显示正常开工。【可能原因】:1、子架间级联网线故障;2、从子架AUX单板故障;3、从子架SCC单板故障。【排查方法】1.检查子架间级联网线是否满足要求,6800主从子架间级联网线要求8根都用且直连。由于随货没有发子架间通信的网线,需要现场制作网线,特别注意网线的8芯要全部做通,将网线制作成标准网线(标准网线两端接头的芯线颜色一一对应,即:白橙、橙、白绿、蓝、白蓝、绿、白棕、棕),否则会导致通信失败的问题。任意芯没有做好,都会引起通信异常2.检查AUX单板是否正常3.检查从子架主控板是否正常Page15HUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidential处理板间通信故障-典型故障案例OSN6800新建扩展子架无法查询到物理板位同时造成原子架大量单板不在位【故障现象】:某扩容工程,在原6800子架基础上,扩展1个子架。接上网线后无法查询到所有物理板位。用cfg-get-phybd也无法查询到全部物理单板;添加已查询到的有物理单板上报槽位非法错误,无法创建逻辑单板。同时该站点原子架多块单板上报BD_STATUS和WRG_BD_TYPE告警。【可能原因】:1、子架ID冲突,新建扩展子架与原有子架冲突2、连接子架的网线有问题【排查方法】1、现场确认子架ID号,设置正确,排除ID冲突原因2、更换网线后情况一样,排除网线问题3、将扩展子架网线断开后,拔出所有单板,然后先将主控插回,待主控板起来后将其余单板插回,所有告警结束,问题解决。Tip:后分析原因为施工顺序有问题;没有问题的网元是在上电前就对AUX进行了拨码操作,然后才上的电。问题网元是上电后再对AUX进行拨码操作,对AUX的拨码需要在新建子架未上电前操作,这样上电后才可以正确的采集到单板信息,新建设备可以考虑修改AUX拨码后直接掉电重启设备。在以后施工中要明确该顺序,避免此类问题的产生。Page16HUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidential附表1:各通信通道内容定义Page17HUAWEITECHNOLOGIESCO.,LTD.HUAWEIConfidential附表2:各主要单元功能说明Page18ThankYou
本文标题:NG WDM产品网元间通信专题-20110411-A
链接地址:https://www.777doc.com/doc-3369978 .html