您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > ISIS特性使用指南
ISIS特性使用指南ISIS的快速收敛1.1I-SPF(IncrementalSPF)I-SPF是指增量路由计算,顾名思义它每次只对变化的一部分路由进行计算,而不是对全部路由重新计算。在ISO-10589中定义使用Dijkstra算法进行路由计算。当网络拓扑中有一个节点发生变化时,这种算法需要重新计算网络中的所有节点,计算时间长,占用过多的CPU资源,影响整个网络的收敛速度。I-SPF改进了这个算法,除了第一次计算时需要计算全部节点外,每次只计算影响的节点,而最后生成的最短路径树SPT与原来的算法所计算的结果相同,大大降低了CPU的占用率,提高了网络收敛速度。这是VRP5的缺省算法,不能修改。1.2PRC(PartialRouteCalculation)部分路由计算PRC的原理与I-SPF相同,都是只计算变化的那一部分。但PRC不需要计算节点路径,而是根据I-SPF算出来的SPT来更新叶子(路由)。在路由计算中,路由代表叶子,路由器则代表节点。如果I-SPF计算后的SPT改变,PRC会只处理那个变化的节点上的所有叶子;如果经过I-SPF计算后的SPT并没有变化,则PRC只处理变化的叶子信息。比如一个节点使能一个IS-IS接口,则整个网络拓扑的SPT是不变的,这时PRC只更新这个节点的接口路由,从而节省CPU占用率。PRC和I-SPF配合使用可以将网络的收敛性能进一步提高,它是原始SPF算法的改进,所以已经代替了原有的算法。这是VRP5的缺省算法,不能修改。1.3LSP快速扩散为了加快整个网络的收敛速度,当IS-IS收到其它路由器发来的LSP时,如果此LSP比自己LSDB中的要新,按原来RFC协议的实现,则是用一个定时器,定时将LSDB内的LSP扩散出去,所以LSDB的同步会比较缓慢。LSP快速扩散特性改进了这种方式,配置此特性的路由器收到一个或多个比较新的LSP时,在路由计算之前,先将小于指定数目的LSP扩散出去,加快LSDB的同步过程。这种方式在很大程度上可以提高整个网络的收敛速度。用户可以使用flash-flood命令指定每次扩散的LSP数量。用于控制LSP快速扩散的命令是Flash-floodlsp-number1-15为提高收敛速度可把lsp-number设成151.4智能定时器改进了路由算法后,如果触发路由计算的间隔较长,同样会影响网路的收敛速度。使用毫秒级定时器可以缩短这个间隔时间,但如果网络变化比较频繁,又会造成过度占用CPU资源。使用SPF智能定时器可以在一定程度上缓解这个问题,它既可以对少量的外界突发事件进行快速响应,又可以避免过度的占用CPU。通常情况下,一个正常运行的IS-IS网络是稳定的,发生大量的网络变动的几率很小,IS-IS路由器不会频繁的进行路由计算,所以第一次触发的时间可以设置的非常短(毫秒级)。如果拓扑变化比较频繁,智能定时器会随着计算次数的增加,间隔时间也会逐渐延长,避免占用大量的CPU资源。与SPF智能定时器类似的还有LSP生成智能定时器。在IS-IS协议中,当LSP生成定时器到期时,系统会根据当前拓扑重新生成一个自己的LSP。原有的实现机制是采用间隔时间定长的定时器,不能同时满足快速收敛和低CPU占用率的需要。为此将LSP生成定时器也设计成智能定时器,使其可以对于突发事件(如接口Up/Down)快速响应,加快网络的收敛速度。同时,当网络变化频繁时,智能定时器的间隔时间会自动延长,避免过度占用CPU资源。在IS-IS协议中,当本地路由信息发生变化时,路由器将产生新的LSP来通告这种变化。当本地路由信息的变化比较频繁时,必须延迟一定的时间产生新的LSP,以避免占用大量的系统资源,导致系统性能下降。但另一方面,如果产生LSP的延迟时间过长,会导致本地路由信息的变化无法及时的通告到邻居路由器,使得网络收敛速度变慢。使用智能定时器可以解决上述问题,它可以根据网络变化频繁程度自动调整延迟时间。用于控制spf调度的命令是timerspfMaximum-interval1-120sInitial-wait1-100000msIncremental-interval1-100000ms控制lsp产生的命令是:timerlsp-generationMaximum-interval1-120sInitial-wait1-100000msIncremental-interval1-100000ms参数说明max-interval:产生LSP的最大间隔时间。init-interval:产生同一LSP分片的延迟时间。incr-interval:两次产生同一LSP分片之间的递增时间间隔,每次都增大为前一次的两倍。如果在2倍的最大时间间隔内没有产生同一LSP分片,则上述计时器会复位。在高端路由器上可参考以下值SPFLSP-Generation参考值缺省值参考值缺省值Maximum-interval1s10s1s5sInitial-wait50ms100ms50ms50msIncremental-interval100ms5s120ms5sIS-IS快速收敛时间参数表这些定时器应根据网络的实际情况和设备的性能进行调整,不能为了追求快速而牺牲了网络的稳定性。1.5网络类型优化IS-IS在广播网上的邻接关系建立过程和point-to-point接口上的处理是完全不同的,当广播网上只有两台物理设备互相链接时,将二者看作broadcast类型的邻接关系的管理优势就体现不出来了(比如DIS的概念),这时可以将他们模拟为point-to-point邻接关系。1.6LSP长度的调整在邻居关系建立以后,邻居之间将进行路由信息同步,为了加快同步的速度,可将LSP长度调大,考虑到长度超过MTU值的LSP会被分片,因此应该先把MTU值改大,但应注意全网的MTU值要改成一致,否则大的分片在小MTU值的接口将不能通过。2路由的稳定性2.1接口damping在网络中,设备接口可能会因各种原因而导致接口频繁up、down,造成路由协议等反复振荡,路由的变化会造成短暂的业务中断,或造成数据流的乱序。为防止不稳定链路频繁up/down造成的路由波动,启动链路Damping机制。当每次链路状态变化时,为其实施惩罚,当惩罚值累计大于一个抑制阈值后,将其抑制(如果此时接口是up也会被认为处于down的状态),IS-IS不再感知其变化。这个惩罚值随着时间呈指数下降,到达一个活动阈值后,解除抑制(此时接口会向协议上报自己最终的状态)。配置:control-flapsuppress1-20000reuse1-20000ceilingsuppress,20000decay-ok1s-45mindecay-ng1s-45min缺省参数为参数suppressreuseceilingDecay-okDecay-ng缺省值20007502000054s54s建议采用缺省参数control-flap使用的是bgp协议的damp算法,提供的可设置参数为5个,接口未被抑止时的半衰期decay-ok接口被抑止时的半衰期decay-ng接口重用门限reuse接口抑止门限suppress接口最大惩罚值ceiling实现的算法如下:当接口第一次收到down事件时,将惩罚值置为1000,惩罚值随着时间衰减,衰减频率由配置的半衰期decay-ok和decay-ng决定,以后每次收到down事件都会将当前衰减后的惩罚值加1000,当惩罚值达到抑止门限suppress时就将接口抑止,如果惩罚值达到了最大惩罚值,惩罚值就不在增加,当接口趋于稳定后,惩罚值降到重用门限reuse,接口就解除抑止。需要注意的是使能了damping以后会影响协议收敛的速度。2.2Graceful-Restart在主控板进行主备倒换时,也需要保持路由的稳定性,这称为不间断路由(NoStopRouting)。目前常用的是Graceful-Restart技术。Graceful-Restart(以下简称GR)是一种冗余容错技术,支持GR能力的路由器在路由协议重启的时候能够确保流量转发的正常,以保证关键业务不中断。在没有采用GR时,由于各种原因引起的主备倒换会导致数据转发的短暂中断,并且会引起全网的路由震荡。如下图:当R1主备倒换时,R2将会中断跟R1之间的邻居关系,并且马上会删除FIB表中相关的转发条目;同时R2会把拓扑变化信息通告给邻居。在R1备用主控板切换成主用主控板并完成路由发布和计算之前所有经过R1转发的数据将会中断。当R1和R2重新建立起邻居后,R2又会把拓扑变化信息通告给邻居,造成网络震荡。对于大型网络特别是运营上来说这些路由震荡和转发中断是不可容忍的,但是采用了GR以后即可避免上述问题。当R1和R2均支持GR时,它们之间通过交换hello报文协商成具有GR能力的邻居关系。当R2检测到R1发生故障时并不中断跟R1的邻居关系,而是启动一个restarttimer,在计时器超时之前R2不会删除和R1的邻居关系,也不会删除和R1相关的转发信息,所有去往R1的流量将继续被转发到R1。R1在主备倒换时也不删除业务板里的转发信息,而是打上一个stale的标记,经过R1的流量也不会中断。R1完成倒换后,会向R2发送一个带restartrequest的hello报文,R2收到后就不会复位跟R1的邻居关系,而是给R1发送一个restartacknowledgement,R1收到后会重建跟R2的邻居关系,邻居关系重建后R1和R2之间会重新同步数据库,完成路由信息的交换,R1经过路由计算后会刷新路由表,完成路由协议的收敛。在这个过程中,R1R2上的数据转发不会中断,R2不会把拓扑变化信息通告给其他邻居,因此网络上除了R2外其他路由均不知道R1的协议重启了,从而避免了由于R1主备倒换给网络带来的震荡。采用了GR技术以后,可以解决网络上个别路由器由于协议重启所带来的丢包和路由震荡,因此建议在全网所有支持GR的路由器上启用GR功能。2.3LSP的老化时间和刷新周期缺省情况下LSP的老化时间为1200s,刷新周期为900s,为了减少LSP周期性更新给网络带来的冲击可考虑把老化时间和刷新周期调大,但由此带来的缺点是无效的路由信息将会长时间驻留在数据库里。考虑到LSP出错的几率很低,建议修改成较大值。3其他特性的使用3.1set-overloadon-startupwait-for-bgp在ISISLSP报文里面定义了一个叫overload的标志位,当该位置位时表示本路由器因内存不足而导致LSDB不完整,其他路由器在计算路由时会忽略掉该路由信息,因此不会把需要此路由器转发的报文发给它,但到此路由器直连地址的报文仍然可以被转发。如下图,图中所有路由器均运行BGP,并且R1,R2,R4,R5都通过RR学到R3发布的1.1.1.1/32路由,正常情况下R1通过路由递归查询查到去往1.1.1.1的下一跳为R2直联R1的接口地址,流量通过R2正常转发到R3。当R2发生故障时,R1会重新计算出到1.1.1.1的链路为R1R4R5R3,流量将通过备份路径到达R3。当R2重新上线后R1到1.1.1.1的流量会重新通过R2转发,但由于BGP的收敛时间要比ISIS长的多,这时候R2上面由于没有到达1.1.1.1的BGP路由,去往1.1.1.1的数据将在R2上被丢弃,在BGP收敛前将出现路由黑洞。如果在R2上启用ISISset-overloadon-startupwait-for-bgp后,R2在启动后会创建一个计时器,在该计时器超时前或BGP收敛之前,R2发布的LSP均打上overload的标记(除直联链路的LSP),于是在BGP收敛之前或计时器超时之前所有去往1.1.1.1的数据不过通过R2转发,而会通过备份链路转发,从而避免了路由黑洞的出现。当R2上BGP完成收敛以后,BGP会通知ISIS清除overload位,从而恢复R2的转发能力。其中5~86400为计时器超时的时间,缺省为600s,应根据网络BG
本文标题:ISIS特性使用指南
链接地址:https://www.777doc.com/doc-2879657 .html