您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 关于防火墙性能测试(RFC2544)
徐涵HillstoneNetworks关于防火墙性能测试(RFC2544)2修订记录日期版本修订摘要07-06-2009V1.0徐涵创建文档09-10-2009V1.0徐涵创作完成3防火墙性能测试标准RFC1242介绍了RFC2544测试所用到的术语。介绍了路由设备(防火墙)性能测试方法,主要是3层的测试。测试吞吐量吞吐量是衡量一款设备转发数据包能力的测试。这个数据是衡量一款防火墙或者路由交换设备的最重要的指标。测试吞吐量首先根据标称性能确定被测试设备的可能吞吐量大小,这样来决定我们测试一款设备所需要的测试仪端口数量。如果一块设备标称性能达到8Gbps,那么通常我们需要8个1000Mbps的测试仪端口来测试。吞吐量的测试通常会选用测试仪所对应的RFC测试套件进行测试。测试的数据包长包括64Bytes,128Bytes,256Bytes,512Bytes,1024Bytes,1240Bytes,1518Bytes。或者使用特定包长或者混合包长(IMIX)进行测试。IMIX流量通常是指用几种数据包混合流量来测试防火墙的吞吐量。我们测试用的比例为64Bytes*58%+570Bytes*34%+1518Bytes*8%,也就是7:4:1。如果需要测试VPN的吞吐量,不能使用1518Bytes,因为会分片,一般改用1400字节测试。吞吐量一般采用UDP数据包进行测试。测试通常采用双向各一条流或者多条流的方式测试。测试流量通常是A-B,C-D双向对打的流量。也存在使用单向流量测试的情况。比如使用3个端口测试,那么流量就是A-B-C-A这样的环形流量。测试仪会采用二分迭代法进行测试。比如测试仪会首先使用100%的流量发包(1sttrial),如果发现丢包,则会采用50%((100%+0)/2)的流量进行测试(2ndtrial),如果发现没有丢包,会采用75%((50%+100%)/2)的流量进行测试(3rdtrial)。通过这种二分迭代的测试最终测试出设备的最大吞吐量数据。测试每一个trial的标准时间为2分钟,每个包长通常会进行10-30个trial的测试(取决于测试仪设置的精确度)。由于测试仪会严格判断是否有丢包,即使有一个包没有收到,都会用二分法往下降。但是这个丢包可能不是设备(网线质量,中间的交换机或者其他原因)造成。因此对于这种情况,测试仪都会有一个losstolerance的设定,通过设定一个恰当的数值来避免其它原因造成丢包对测试结果的影响。在进行对一款设备的吞吐性能测试时,通常会纪录一组从64Bytes到1518Bytes的测试数据,每一个测试结果均有相对应的pps数。64Bytes的pps数最大,基本上可以反映出设备处理数据包的最大能力。仅仅从64Bytes的这个数我们基本上可以推算出系统最大能处理的吞吐量是多少。因为通常衡量一款网络设备的CPU/NP/ASIC的最大处理能力的极限就是64Bytes的pps数。很多路由设备的性能指标有一点就是宣称xxMpps,所指的就是设备处理64Bytes的pps数。比如64Bytes的pps为100000pps,吞吐量为100000*(64+20)*8/1000000=67.2Mbps,拿这个结果计算1518Bytes的数据为100000*(1518+20)*8/100000=1230.4Mbps。其中的20Bytes是指12Bytes的帧间距(IPG)以及8Bytes的前导码(7Bytes同步+1Bytes起始),测试每一5个字节的吞吐量都需要将这20字节计算在内。通过前面的算式可以看出,我们即使不测试1518Bytes的吞吐量也能够大致推算出设备最大的吞吐量是多少。而最终的结果只能=这个结果。测试中涉及的配置情况包括:透明模式,路由模式,配置NAT,配置policy,配置AV扫描,配置QoS等。我们的设备在配置大量policy的情况下的吞吐量不会有太大变化。在配置双向或者单向NAT后吞吐量大约是路由模式的98%左右。透明模式的吞吐量大约是路由模式吞吐量的80%左右。6时延时延所测试的是系统处理数据包所需要的时间。防火墙的时延测试的是其存储转发(StoreandForward)的性能(另一种是CutandThrough)。时延的测试通常会选用测试仪所对应的RFC测试套件进行测试。测试的数据包长包括64Bytes,128Bytes,256Bytes,512Bytes,1024Bytes,1240Bytes,1518Bytes。或者使用特定包长或者混合包长进行测试。采用UDP数据包进行测试。测试通常采用双向各一条流的方式测试。时延的测试通常是建立在测试完吞吐量的基础上进行的测试。测试时延之前需要先测出每个包长得吞吐量大小,使用每个包长的吞吐量结果的100%-90%作为时延测试的流量大小。一般时延的测试要求不能够有任何的丢包。因为如果丢包,会造成时延非常大,结果不准确。我们测试一般使用最大吞吐量的95%或者90%进行测试。测试结果包括最大时延,最小时延,平均时延,一般记录平均时延。如果测试得比较精细,也可以测试在不同负载下的时延。比如可以测试在10%,20%...直到最大负载的结果下的时延。测试时长通常是设置2分钟的流量,然后测试几次取平均值最为最终结果。测试中涉及的配置情况包括:透明模式,路由模式,配置NAT,配置policy,配置AV扫描,配置QoS,配置AD等。我们的设备在配置大量policy以及NAT的情况下的时延不会有太大变化。7丢包率丢包率是测试系统在一定负载的情况下丢包数量多少的测试。这个测试实际上和吞吐量测试类似。测试的意义在于通过过载的流量来考查对设备正常转发性能的影响。丢包率的测试通常会选用测试仪所对应的RFC测试套件进行测试。测试的数据包长包括64Bytes,128Bytes,256Bytes,512Bytes,1024Bytes,1240Bytes,1518Bytes。或者使用特定包长或者混合包长进行测试。采用UDP数据包进行测试。测试通常采用双向各一条流的方式测试。测试方法通常是采用10%--100%的流量分别测试被测系统的丢包情况。当测试100%负载的情况事,对于NP/ASIC架构的防火墙来说,丢包率=1-吞吐量(%)。因为NP和ASIC转发更依靠硬件的性能,而硬件的性能通常比较稳定。而对于多核和x86架构的防火墙来说,转发依靠CPU的计算,性能相对硬件转发来说相对较弱,所以100%负载的丢包率1-吞吐量(%)。比如我们测试出NP墙的吞吐量是80%,那么100%的丢包率基本上可以推算出等于20%,而多核和x86架构的防火墙的丢包率大多数情况20%。所以,丢包率的测试对于我们产品的测试不是很有利。不过丢包率的测试在一般的对外测试中并不常见。8系统恢复时间系统恢复时间的测试在一般的对外测试中不太常见,但是电信客户还是比较关注这个性能。这个测试包括:系统重起的时间测试,系统断电重起的时间测试,HA倒换时间测试,HA恢复时间测试,系统过载恢复测试(这个一般很少见)。系统重起的时间测试,系统断电重起的时间测试通常会纪录系统重新启动所需要的时间。HA倒换时间测试,HA恢复时间测试对于电信运营商来说是一个很重要的指标,测试包括主备切换时间测试,备主恢复时间测试。通用的测试方法为:使用测试仪发送恒定速率的流量穿过DUT,DUT进行reset,或者断电操作,直到流量恢复正常。恢复时间=丢包数量/发包速率。另外一种测试方法是通过ping包丢弃的数量来衡量倒换的时间。我们产品测试HA的倒换时间由短到长分别是:断电拔线shutdown接口。HA的倒换时间不是我们设备的优势项目,所以如果可能,尽量不进行这个测试。9背靠背缓冲测试背靠背缓冲测试主要测试被测设备缓冲处理burst数据的能力。考验的是被测设备处理突发数据流缓存数据并快速处理的能力。这个测试在一般的测试中并不常见。测试方法和结果和吞吐量有很多相似的地方。测试仪向背测试设备发送一定流量大小的数据包,发送时间通常为1-2秒,然后看接收端能够收到多少的数据包。通常线速转发的设备的背靠缓冲能力和吞吐量的pps相一致。比如,一台设备能够线速转发双向2Gbps的流量,那么背靠背缓冲性能(发送时间为2秒)基本上可以确定是148万*2*2pps。到目前为止,任何对外测试还没遇到测试这个用例的情况。10主要测试仪介绍IXIA主机:IXIA400TIXIA1600T等插卡:STXS4(4GEcombo)CPMT8(8GEcooper)软件:IxExplorer(发包软件)IxLoad(L4-L7RFC3511测试)IxAutomate\IxNetwork(L3RFC2544测试)Spirent主机:TestCenterSmartbits600BSmartbit6000BAvalanche2500Avalanche2700Avalanche2900等软件:SmartWindow(发包软件)SmartFlow\SmartApplication(L3RFC2544测试)AvalancheCommander(L4-L7RFC3511测试)两个厂家测试仪的优缺点软件方面:Spirent的SmartWindow,SmartFlow,SmartApplication软件功能较IXIA的更为简便易用,但是Avalanche的软件比IXIA的要复杂,但更专业。采用默认的配置,Spirent的任何测试结果都要比IXIA的结果好。硬件方面:Spirent的Smartbits和IXIA的差不多,但是Spirent的Avalanche2700\2900比IXIA的CPM卡要强大很多。总体评价L3的测试用哪家都行,只是Spirent的更好用。L4-L7的肯定Spirent的性能更高,但是Avalanche不能够测试TCP的新建连接速率只能测试HTTP的流量,不能够测试出我们设备的标称值。11测试数据吞吐量通常的计算单位为Mbps或者Gbps需要记住的几个数值:100Mbps=14.8万pps1000Mbps=148万pps如何通过pps数量计算带宽吞吐量Mbps(测试包+20)Bytes*8bit*pps/1000000=xxxMbps一般测试仪测试的结果只是给出一个百分比,指的是不丢包的最大带宽的百分比,输出结果需要乘以测试的最大带宽。最终的结果可能会有误差,但是相差不应该超过3%。时延通常的计数单位为微秒(us),一般性能较好的防火墙(包括我们的)64Bytes-1518Bytes的性能大都在10-100us左右,如果出现达到100us以上的结果,那么需要从新测试,肯定是丢包比较多了。IXIA统计的结果是ns,Spirent统计的是us。一般我们设备的时延数据从64Bytes到1518Bytes大约是10us-50us。12其他防火墙厂家性能数据分析Juniper测试数据和宣称的数据结果基本一致,最新的SRX数据标称的还更保守一些。吞吐量的数据基本上是中长包的测试结果。并发连接的数量和我们的标称方式一致,可以显示也可以测试到最大。新建连接速率和标称值基本一致。由于ASIC架构的限制,新建速率都比较低。目前Juniper最新推出的SRX系列防火墙(包括SSG系列)的新建连接速率已经不再标称HTTP的新建连接速率了,标称的都是TCP-no-close的结果。Fortinet的防火墙基本采用x86+端口加速的转发模式,所以跨端口转发吞吐性能,新建连接性能都不高。防攻击性能很弱。具体结果参见以下文档。Fortigate-3016BTestReport.pptfortinetf620b防火墙性能测试结果06-18-2009.doc清华网络安全实验室高端防火墙安全检测报告-6P.pdf13测试中常见问题下面总结了目前遇到的大多数导致测试数据异常的原因以及解决方法:1.其他
本文标题:关于防火墙性能测试(RFC2544)
链接地址:https://www.777doc.com/doc-1502048 .html