您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 主从通信系统可靠性-第060组(韦建)课程设计报告(初稿)
多机通信系统的可靠性评估的建模和仿真组号060姓名:韦建学号:5090309218,姓名:戴泽宇学号:5090309221摘要:本实验通过仿真一个一主三从的多级通信系统,在3种提高系统可靠性的措施的不同组合下,估算100个系统运行10年情况下因元件故障等原因造成的人工修理次数,系统故障平均发生次数,系统重大故障平均发生次数,平均无故障时间,平均无故障连续时间,平均无重大故障连续时间一系列运算指标。关键词:主从多级,仿真,可靠性ModelingandsimulationaboutamulticomputercommunicationsystemABSTRACT:TheexperimentalsimulationaLordSanCongmulti-levelcommunicationsystem,inthreekindsofimprovingthereliabilityofthesystem,underthedifferentcombinationmeasuresestimated100systemrun10yearscasesofacomponentfailurecausesartificiallyrepairtimes,theaveragenumberofsystemfailurehappens,theaveragenumberofmajorfaultoccurredsystem,MTBF,averagetrouble-freecontinuoustime,averagenomajorfaultcontinuoustimeseriesofoperationindex.Keywords:Master-slavemulti-stage,simulation,reliability1引言1.1问题的引入[1]系统中有1台通信主机和3台通信从机。所有通信主/从机使用共享信道建立物理连接。每台通信机内部有两块电路板:控制电路板和接口电路板。控制电路板上有微处理器,运行相应的软件程序。接口电路板负责与通信总线联系,它的某类故障,会引发总线阻塞。光电隔离器完成电-光-电信号转换,通过电气隔离增加安全性。其内部采用了提高可靠性为目的的元件冗余设计。光电隔离器无法阻止接口电路故障引发的总线阻塞。集线器是一个通信线缆的汇接装置。1.2部件划分和元件的组合方式[2]控制电路板可看作两个部件组成:“控制硬部件”对应硬件电路部分,“控制软部件”对应软件程序部分。控制硬部件可看作由35个统计特性独立元件构成,并适用串联组合。控制软部件可看作单元件构成。未使用措施2前,接口电路板可看作由10个统计特性独立元件构成的“接口部件”,并适用串联组合;使用措施2后,接口电路板可看作由15个统计特性独立元件构成的“接口部件”,并适用串联组合。光电隔离器可看作由5个统计特性独立元件构成的“光隔部件”,其中任意3个元件无故障即能使该部件正常发挥效能,适用k-out-of-n组合,k=3,n=5。集线器可看作由7个统计特性独立元件构成的“集线器部件”,并适用串联组合。1.3故障后果[3]控制硬部件、集线器部件、接口部件组成元件的故障需要依靠人工修复。未采取措施1时,控制软部件组成元件的故障需要依靠人工修复;采取措施1以后,控制软部件组成元件的故障中有97%可以通过自动重启恢复(故障状态的持续时间可认为1小时),还有3%的故障需要依靠人工修复。未采取措施2时,接口部件组成元件的故障中有7%会引发总线阻塞;采取措施2以后,可完全避免引发总线阻塞,但并不能降低元件故障发生率。未采取措施3时,通信主机子系统一旦有故障即刻完全失效。采取措施3以后,在互为备份的双机同时失效时,子系统失效,即双机适用并联组合。但这不是严格意义上的并联组合,如果未同时采取措施2,双机热备配置中的单机接口电路硬件故障的引发总线阻塞,仍会造成系统失效。光隔部件组成元件的故障可以自动恢复(故障状态的持续时间可认为1小时)。1.4理论模型[4]控制软部件1控制硬部件s接口部件s通信主机子系统集线器部件s集线器子系统控制软部件1控制硬部件s接口部件s通信从机子系统2光隔部件k控制软部件1控制硬部件s接口部件s通信从机子系统1控制软部件1控制硬部件s接口部件s通信从机子系统3光隔部件k1单元件kk-out-of-n组合s串联组合p并联组合1.5仿真实验要求[5]根据前文提出的理论假设、基本参数和理论模型,确立仿真算法,利用蒙特卡洛法模拟100套同型系统连续运行10年的各种状况。分别在1)不采取措施1、2、3;2)单独采取措施1;3)单独采取措施2;4)单独采取措施3;5)同时采取措施1、2、3这5种情形下,求解以下系统指标:(10年中)人工修理平均次数(10年中)系统故障平均发生次数(10年中)重大系统故障平均发生次数(10年中)平均无故障运行时间平均连续无故障运行时间平均连续无重大故障运行时间2研究思路和研究过程(1)无措施对于这样一个一主三从的通信模型,因为每个部件里的元件数量都已经知道,为了能够求解系统指标,我们小组的思考方法是分别对每个元件用数字进行标注,从而建立3个矩阵,分别对应系统所有元件的前1小时,当前以及后一小时是否故障的情况。pre=zeros(1,201);next=zeros(1,201);ppre=zeros(1,191);以无措施为例,因为各个部件里的元件发生故障的概率不同,加上人工修复成功与否,我们设立了4个概率常数。p1=1-exp(-1/300000);p2=1-exp(-1/8);p3=1-exp(-1/20000);p4=1-exp(-1/7000);以此常数,我们可以通过每一小时的检测,判断元件的工作情况,分别分为控制硬部件,集线器,接口部件;控制软部件;光电隔离器三个部分。同时对于已坏的元件是否已经人工修复进行检测,得到此元件的前中后三个情况。其中因为光电隔离器发生故障后会自行恢复,所以如果此刻故障,则下一小时必会恢复正常。下面是程序中的第一部分为例。%控制硬部件,接口部件,集线器部件fori=1:187if(pre(i)==0)if(rand(1)p1)next(i)=0;elsenext(i)=1;end;elseif(rand(1)p2)next(i)=1;elsenext(i)=0;end;end;ppre(i)=pre(i);pre(i)=next(i);end;接着,我们开始对主机,从机1、2、3,和集线器从整体上判断故障情况。其中因为从机与光电隔离器相连,对于3-out-5模式我们要和其他串联模式区分开。以下以主机为例%通信主机子系统故障状态判断if((sum(pre(1:45))+pre(188))=1)system1err=1;elsesystem1err=0;end;对于从机接口部件会造成7%的总线阻塞情况,我们做了如下处理fori=1:4forj=45*i-9:45*iif(pre(j)==1&ppre(j)==0&rand(1)0.93&interface_jam(i)==0)interface_jam(i)=1;elseinterface_jam(i)=0;end;end;end;if((sum(interface_jam(1:4))=1))jam=1;elsejam=0;end;对于系统重大故障判断以及次数统计,我们的解决方法是如果主、集线器均无故障,不超过一个从机发生故障以及没有发生总线阻塞则系统未发生重大故障,如果相反则发生,且重大故障次数+1。同时为了求取无重大故障运行时间,我们首先建立了一个零矩阵,如果这一小时系统无重大故障,则矩阵的当前一位数+1,如果系统经检测发生重大故障,则矩阵当前位先后前进一位。最终将此矩阵的每一位上的数字加和即可获得无重大故障的时间。对于系统故障判断和次数统计,采用相同的方法。此处是如果不包括光隔在内的其他元件只要有一个故障或每个光隔内的元件有3个及3个以上发生故障即为系统故障,且次数+1。以下为系统故障部分。%系统故障次数统计err_cnt=sum(pre(1:191));if(sum(pre(192:196))=3)err_cnt=err_cnt+1;end;if(sum(pre(197:201))=3)err_cnt=err_cnt+1;end;if(err_cnt)=1y=1;elsey=0;end;系统无故障运行时间以及故障次数可以采用马尔可夫模型,用同样的方法得到。关于人工维修次数,除去光隔内可自行修复的元件,其他元件只要前一小时故障,下一小时正常即人工修复次数+1。(2)措施1措施1采用watchdog,未采取措施1时,控制软部件组成元件的故障需要依靠人工修复;采取措施1以后,控制软部件组成元件的故障中有97%可以通过自动重启恢复(故障状态的持续时间可认为1小时),还有3%的故障需要依靠人工修复。此处需要改动的地方即控制软部件部分,如下%控制软部件fori=258:262if(pre(i)==0)if(rand(1)p3)next(i)=0;elsenext(i)=1;end;elseif(rand(1)0.97)if(rand(1)p2)next(i)=1;elsenext(i)=0;x=x+1;end;elsenext(i)=0;end;end;ppre(i)=pre(i);pre(i)=next(i);end;同时在计算人工维修次数时要将软部件与其余部件分开,因为它的故障有很大程度是可以自行解决的。(3)措施2未采取措施2时,接口部件组成元件的故障中有7%会引发总线阻塞;采取措施2以后,可完全避免引发总线阻塞,但并不能降低元件故障发生率。即将有关总线阻塞的部分设定屏蔽掉。(4)措施3措施3采取主机双击热备,即增加一个主机部件。未采取措施3时,通信主机子系统一旦有故障即刻完全失效。采取措施3以后,在互为备份的双机同时失效时,子系统失效,即双机适用并联组合。3实验过程中遇到的问题(1)在求解平均连续无故障运行时间的时候,我们小组起初将平均连续无故障运行时间放入一个样本里算出,然后求和再除以100得到,实际上与题目给出的定义不符。后来我们将所有的系统指标都从小循环中脱出,先将100个样本得到的连续无故障时间加和算出,再除以100个样本所有无连续的完整时间片段数目。(2)在求解平均连续重大故障运行时间的时候,我们小组原本错误地将分母单纯地设置成重大故障次数,后来发现一次故障将时间分成两断,对于一个样本,分母应为重大故障次数+1,对于100个样本,即+100。4实验结果与分析采取的措施无措施1措施2措施3措施1、2、3平均修理次数72.5555.277.8392.1375.96平均故障次数71.9172.3177.2291.2497.15平均重大故障次数20.0520.0821.63.332.23平均无故障运行时间8698387107869398681586929平均连续无故障运行时间11921187.21110.5973.1708884.6882平均连续无重大故障运行时间4153.44148.938682022727115运算耗时(s)2597.82657.82889.93896.53447从实验结果可以看出,单独使用措施1可以有效地减少人工维修次数,而单独使用措施3将会令人工维修次数增多。单独使用措施3或使用措施1、2、3均能有效地减少重大故障出现的次数,但是同样会引起一般故障次数的增多;而措施1与2并不能减少重大故障的次数。平均连续无故障运行时间会因措施1、2、3的采用而越来越少。措施3与措施1、2、3可以有效地让连续无重大故障运行时间增多。5.参考文献[1]课程设计讲座2:主从通信系统可靠性问题建模和仿真[2]PDFMATLAB实用教程[3]DOC“主从多机通信系统可靠性建模研究”案例一的要求V6
本文标题:主从通信系统可靠性-第060组(韦建)课程设计报告(初稿)
链接地址:https://www.777doc.com/doc-2767445 .html