您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文化 > 动力环境监控系统及其故障分析与处理doucin
动力环境监控系统及其故障分析与处理摘要本文首先对动力环境监控系统架构进行描述,着重阐述在实际运用中的组网传输方式,定义监控的对象;然后以实际的案例分析为基础,探讨如何运用不同的方法去解决故障问题。关键词动力环境监控、故障案例分析、处理方法随着移动通信事业的飞速发展,对通信机房的电源动力和环境指标的要求不断完善,通信电源和空调的作用越来越重要,对通信机房动力环境集中监控系统的要求亦愈发严格。良好的机房动力环境监控系统不仅可以及时上传代表机房动力指标和环境质量的各类数据,反映实时的告警信息,更可以方便维护人员进行后续故障排查处理并对特定的数据信息进行有效分析。既可以达到对突发事件的及时响应,也能指导今后的实际工作。通信机房在动力环境监控方面的根本需求和特点是需要首先掌握的,这是开展工作的前提条件。而工作的目的则是及时解决问题并在今后的工作中作为理论依据加以分析研究。1.监控对象从维护人员的视角出发,对监控对象的特性可以基本分为三类:按用途分类、按电特性分类、按性能分类。按用途分类可以分为通信动力系统监控和通信环境系统监控。其中通信动力系统包括高压配电、低压配电、开关电源、交流稳压器、UPS、整流器和蓄电池组等动力设备,通信环境系统包括机房用精密空调、门禁系统、温湿度、红外、烟雾、水浸、动态图像等环境量。按电特性分类又可以分为两部分,除了按电量和非电量区分,也能按数字量和模拟量区分。对于非电量,需要经过特定的传感器将非电物理量转换成适合采集设备的电信号,然后接入数据采集设备;对于电量,则通过变送器将其转换为适合采集设备输入范围的电信号。而信号量与模拟量的区别在于,模拟量是随着时间轴连续变化的,数字量是时间和信号均为间断的,仅由“0”和“1”两种状态表示的。按性能分类可以分为智能设备和非智能设备。非智能设备没有数据采集和处理的能力,需要通过采集器采集数据再接入监控系统。智能设备本身具有一定数量的传感器和变送器,可以进行数据采集和处理,通过其智能设备协议规范,由智能接口直接与监控系统进行通信。一般在实际应用中,选择以下四种性质的参数进行监控:遥测量(AI)、遥调量(AO)、遥信量(DI)、遥控量(DO)。对于监控系统,AI/AO代表模拟信号的输入/输出,DI/DO代表数字信号的输入/输出。在通信机房里,动力环境监控的实体对象有:高/低压配电、交流配电屏、整流屏、直流配电屏、蓄电池组、逆变器、UPS、精密空调、环境指标、门禁系统、动态图像等。2.传输方式动力环境监控系统的传输资源比较丰富,可以根据实际情况采用不同的传输介质和组网方法。在实际应用中,主要使用了2M资源和数字公务通道。2M资源又称为E1线路,是基于公司现有传输设备,诸如SDH提供。2M线路将一个2048kbps的比特流分成32个64kbps的通道,每个通道就是1个时隙,由0到31编号,其中的0时隙作为交换机之间同步用,其余的时隙则用来承载其他业务。利用时隙分接复用设备可以将2M(E1)线路按照不同的时隙分成若干通道提供给多个设备使用,这大大提高了数据传输的能力。数字公务通道提供V.11接口/标准的RS232接口/RS422接口,可以直接使用。3.组网方式动环监控系统采用E1接入设备的2M组网方式,由图1所示。图1监控组网方式这种方式的主要优点在于传输可靠,若有监控动态图像传输的话,其传输实时图像的效果比较好(实时图像对带宽的要求比较高,模拟图像数字化后大约有100M,经过压缩可以达到384K~2M之间)。在端局,我们使用了前置机下挂不同总线,进而在每条总线下连接MISU,EISU,BMU,HVBMU等,对机房的动力环境进行全面监控。前置机系统作为网管系统数据采集的核心,集中管理采集模块,前置机的工作方式是以总线为单位扫描数据,每条数据扫描总线可以并行独立地工作。根据端局的物理位置,可以进行优化处理,比如一台前置机可以接入一个较大的区域里所有的采集分析设备。通过SDH/PDH线路进行传输,将端局的监控参数体现在业务台并存储于数据库服务器内。通过业务台,工作人员就可以方便查询到整个系统的详细情况。监控系统的及时数据端局1数据库服务器综合业务台E1接入设备SDH/PDH前置机总线3总线2总线1MISU端局2端局32M局域网上传,告警准确反映,报表查询统计,动态图像管理等都可以在监控业务台直观地展现。4.故障处理及案例分析客观地说,设备在运行过程中出现故障和告警是难以避免的,尤其是突发性的故障。维护人员除了需要规范完成日常和周期性的例行维护之外,还必须掌握对于突发性故障和告警的维护处理办法。这就要求在业务技能方面和操作规范方面都有较强的能力,这样就可以做到尽快消除故障和隐患,以便用最短的时间恢复设备的稳定运行,保障机房动力环境指标。故障处理的基本方法是将造成故障可能的原因汇总,在一个大集合内分解成若干小的子集,把复杂问题一步一步简单化,排查定位后采取适当的方法解决故障,流程如图2所示。图2故障处理流程遵循以上的故障处理流程,根据不同的问题采用具体的方案,就可以快速准确地判断故障原因,找出故障点,最后解决故障问题。下面根据不同案例的分析,进行初步的探讨。故障或告警产生故障告警的原因信息收集分析故障定位排除故障处理完成,设备正常运行4.1逐步排除法故障产生的原因十分复杂,但是,在统计学上分析,各种因素同时作用并导致设备发生故障的概率是很小的,而设备故障成因在某一具体时刻具有单一性。因此,在处理实际故障告警时,利用逐步排除法可以大大缩小故障范围,加快故障定位。案例1:动环监控显示某汇接机房出现B相电压欠压告警。工作人员赶到现场后,发现HC6000表所示B相电压为200V。由于机房其他设备均运行正常,并且实测三相供电电压正常,所以怀疑是HC6000表出现故障。现场使用万用表测量表内端点的电压情况,实测数据显示B相电压为200V,与监控系统数据一致,故排除是由HC6000表故障造成。用万用表测量为HC6000表供电端三相电压,显示正常。排除总闸到一次侧之间线路有问题。继续测量二次端,发现B相电压为200V,则断定故障点在二次侧。再仔细观察,发现二次侧的线路被进线管压迫,可能造成线路端子虚接。将端子紧固之后,HC6000表B相电压恢复正常,故障处理完毕。4.2替换法在监控系统中,不管采取什么样的组网方式和使用多么复杂的设备,我们都可以将各个组成部分单独处理。当设备出现故障或告警的时候,模块化的组织结构可以让工作人员很便利地更换故障部件,快速解决故障问题。只要有多余的正常备件,工作人员就可以用之替换怀疑有故障的模块,如果问题得以解决,则说明是模块确实产生故障。案例2:动环监控显示某汇接机房门禁无法正确上传开关门数据。工作人员现场测试,发现开关门和门禁电源均正常,怀疑门禁控制器上传数据出现故障。现场更换一套新的门禁控制器,所有监控量恢复正常。案例3:动环监控显示某通信枢纽交换机房MISU数据无法正常上传。工作人员到达现场后,测试出MISU-S板件电源模块故障。更换一套新的MISU-S集成电路板,检查核对地址拨码,连接各走线后上电运行。将PC连接MISU-P板读数据正常,电源模块温度正常,MISU恢复正常运行。4.3对比法在整个监控系统中,受控设备的种类很多,但是每一种类的设备数量也是很多的,所以可将故障设备与正常设备之间做全面的对比,从数据配置到实际安装进行比较,然后分析解决故障。案例4:动环监控显示某通信枢纽电力机房1#温湿度传感器高温告警。工作人员到达现场,用温湿度测量仪进行测量,机房温湿度指标合格,说明故障原因是1#温湿度传感器造成。查看数据配置,对比机房内同样类型的2#温湿度传感器配置,发现这两个温湿度传感器均为电流型,但是1#在配置选项上设置为电压型,更改后温度显示正常。4.4解析法监控系统中,主控设备与受控设备之间的信息传递依靠两者之间透明的通信协议,在有些情况下,机房设备制造商的协议无法准确区分不同的告警量,所以工作人员必须在故障发生的时候通过经验和搜集到的信息做出合理的判断,将一个混合的信息解析为一个单一的信息,准确定位故障点和故障原因。案例5:动环监控显示某通信枢纽IT机房3#精密空调2#压缩机高压告警。工作人员现场检查该精密空调2#压缩机两侧吸排气压力,发现压力值并不高,反而出现压力值偏低,首先可以排除真正的高压告警。进一步测试压缩机温度,确定吸气温度过高。联系厂家工程师后,确认在该品牌精密空调,压力信号和温度信号是串联的,统称为高压告警,所以实际上这是一个温度过高告警。那这是为什么造成的呢?因为在精密空调制冷过程中,如果制冷剂偏少,可能会造成压力降低,这时在压缩机吸气口的温度就会相应上升,所以会产生此处的高温告警。工作人员仔细检查精密空调制冷环路,发现在回气口处针阀形变产生制冷剂泄漏。更换新的针阀后充入适量的制冷剂,系统重新恢复正常,设备运行稳定。4.5理论指导法在监控系统的安装调试过程中,由于系统纷繁复杂,难免会出现小的疏漏,并可能导致在工作中出现各种不准确的监控数据,严重的甚至产生误告警。如果出现这样的情况,工作人员应当及时记录案例,寻求合理的解决方案,在理论上建立正确的体系,便于指导以后的工作。案例6:动环监控系统显示某通信枢纽IDC机房1#温度数据与其他温度数据相差过大,不具有代表性。现场勘察后,发现1#温湿度传感器安装位置不合理,处于设备散热出风口正对位置,更换合理的安装点后数据能正确代表机房环境量。通过理论分析得知,温湿度传感器的安装应当尽量避免设备出风口,精密空调出风口和风路死角等位置,这样才能获得一个稳定的具有代表性的温湿度数据。同样的道理,机房水浸传感器应当避免处于布线沟道的最下方而受到潮气的干扰产生告警。在集中监控系统中,在数据库的支持下,工作人员可以方便地对设备运行情况进行汇总和统计,在报表业务台上可以得到清晰的周期报表和曲线图。这使得我们可以在宏观上随时掌握整个系统的运行状况,因而在查询周期内发生的变化也可以得到直观的反映,甚至可以在故障和告警发生之前就及时发现问题,防范险情于未然。5.总结在环境能源问题十分突出的今天,中国移动天津公司积极响应国家号召,在各个方面采取措施节能减排,采用动力环境集中化监控的根本目的是为了提高设备的维护管理质量,降低系统设备维护成本,提高整体工作效率,实现节约人力成本和能源消耗。我们需要深入监控系统的系统架构,在宏观的组网与分配和微观的设备信号采集点都要有足够的理解,依靠所掌握的大量信息分析故障告警,优化监控中存在的各种问题。实际工作中遇到的问题千变万化,只有不断丰富知识,积累经验,总结教训,才能在维护中合理解决故障告警,保障通信设备和环境指标正常稳定。
本文标题:动力环境监控系统及其故障分析与处理doucin
链接地址:https://www.777doc.com/doc-4434267 .html