您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 面向应用层的流媒体性能测量指标
面向应用层的流媒体性能测量指标摘要介绍了一种从流媒体接收者的角度对流媒体性能进行测量的方法,提出了相应的应用层评价指标。利用已有的商业化流媒体服务软件,通过改变网络环境在不同的条件下对指标进行测量,最后通过实验数据来验证这些指标的有效性。引言流媒体是指在Internet/Intranet中使用流式传输技术的连续媒体,如音频、视频、动画或其他多媒体文件。它的内容可以是预先经过编码处理、存放在一个或多个服务器上的媒体文件,也可以是实时的音/视频媒体。传统的Internet应用需要可靠的数据传输,对延迟和抖动不是很敏感,但是在流媒体应用中情况则完全不同。流媒体应用能够容忍一定程度的包丢失,但是对延迟和抖动却很敏感。由于各种原因,在以IP协议为核心的互联网上提供流媒体服务时,流媒体的性能经常随着网络和时间的变化而变化,不能满足用户的需求。为此,除了采用一些内部机制保证业务质量外,还需要从外部对流媒体业务性能进行测量,了解流媒体应用的瓶颈,从而提高性能。同时,为了推动流媒体新的网络协议的设计和开发,必须有一套能够衡量媒体接收端的媒体质量标准。早些时候,研究者也提出过各自的媒体性能衡量指标,有些是基于传输层的,通过测量传输层的参数进行媒体性能评估;有些关注于接收者观看时的生理反应或者需要人为参与。实践证明这些方法均能够在一定程度上反映流媒体的性能,但这些方法部署起来复杂,而且结果也易受主观因素的影响。本文引入了一套面向应用层的流媒体性能衡量指标,测量方法相对简单,并且能够直观反映流媒体的接收质量。最后在RealNetworks公司的流媒体系统中,通过改变网络环境来验证这些指标的有效性。1相关工作1.1主观评价国际电信联盟(ITU)在ITU-RBT.500-11中推荐使用平均主观得分法(MOS)来评价接收者感知的媒体质量。做法通常是给接收者播放一段视频(约8~10s),接收者采用5分制评价。其中5分为很好(excellent),4分为好(good),3分为中(fair),2分为差(poor),1分为不可接收(unsatisfactory)。记录他们的评分,然后对所有评论者的评分进行统计,得出平均分作为评价结果。MOS为接收媒体质量提供了定量指标,但是对流媒体而言,这种评价方法存在着弊端。MOS的特性使得必须有接收者参与(评分),这将花费大量的人力和时间,并且这种方法不能避免主观因素的影响。另外在ITU-RBT.500-7标准定义了两种主观的评价方法,即双刺激连续质量分级法(DSCQS)和单刺激连续质量评价方法(SSCQE),不过这些方法已经被ITU-RBT.500-11所取代。1.2客观测量客观测量基于仿人眼视觉模型的原理对图像质量进行客观评估,并给出客观评价分。近几年,随着人们对人眼视觉系统研究的深入,客观测量的方法和工具不断被开发出来,其测量结果也与主观评价较吻合。国际上成立了ITU-R视频质量专家组(VideoQualityExpertsGroup,VQEG)专门研究和规范图像质量客观测量的方法和标准。VQEG规定了两个简单的技术参数,即峰值信噪比(PSNR)和均方差(MSE);此外还有许多图像质量模型,这些模型在测量图像质量时都基于人眼视觉特性。一些研究者认为,当发生丢包或者低速率传输媒体时,这种测量方法不能很好地工作,而且也不能刻画应用层的一些关键信息,如再缓冲次数、平均缓冲时间、帧率(FPS)等。2应用层媒体性能测量指标2.1媒体播放器的播放原理当前主流的商业流媒体播放产品主要有Real公司的RealPlayer、Microsoft公司的MediaPlayer、Apple公司的QuickTime。它们虽然属于不同的公司,但是播放流式媒体的基本原理是相同的。图1给出了以视频点播和广播为例考察用户获取流媒体服务的典型流程。接收者和服务器之间需要通过三次交互才能获得流媒体内容。首先是用户浏览器和Web服务器(流媒体内容的发布点)交互,以获取具体的流媒体内容定位信息(媒体源文件的URL)。然后,用户浏览器通过内容定位信息获得具体的媒体源文件。该源文件通常是一个SMIL或者XML格式的媒体同步和控制文件,包含了具体的流媒体内容的位置(URL)和控制方法。然后,在客户端,流媒体的源文件触发用户端的媒体播放器。最后,媒体播放器根据源文件的要求安排媒体流,同时根据媒体流的URL请求流媒体内容传输。2.2流媒体播放器的相关特性大多数的媒体播放器在播放流媒体之前,媒体数据先要在接收端缓冲,其主要作用是平滑媒体数据传输波动,提高播放质量。缓冲区的大小和利用百分比决定了播放过程中接收者的接收质量。在播放过程中,如果缓冲的数据不够甚至传输中断,播放器会进行重缓冲,重缓冲会严重影响服务质量、降低收看效果。RealNetworks公司的RealPlayer是使用较多的几个流媒体播放器之一,本文选用它作为播放器。首先介绍几个相关的特性:a)流技术。RealPlayer能够从流媒体服务器接收流化的媒体内容。这期间要用到一些相关的传输协议,如RTSP等。当然也可以选择TCP、UDP、HTTP等协议。b)自适应带宽。RealSystem采用SureStream,通过测量网络的当前状况调整流媒体的比特率来适应网络,使用户获得更好的效果。Microsoft公司的intelligentstreaming也可以达到同样的效果。要达到自适应带宽的目的,还需要多比特编码(多层编码)技术支持。c)缓冲区初始化。RealPlayer需要初始化播放器缓冲区,消除媒体服务器与播放器之间的网络延迟带来的负面影响。设置大的缓冲区可以容忍更大的网络延迟,同时也增加了播放延迟,因此缓冲区并不是越大越好。d)再缓冲。当网络条件恶化时,RealPlayer有可能耗尽缓冲区内的媒体数据。这时播放器不得不停止播放(没有数据),等待新的数据填充缓冲区。2.2性能测量指标根据以上分析,本文提出了面向应用层的测量指标:a)缓冲时间。从流媒体数据到达播放器到开始播放的时间。这个时间与缓冲区大小、网络环境有关。缓冲时间可以衡量媒体流数据传输的延迟和延迟抖动等性能,对流媒体播放的性能有直接影响。b)播放速率。由帧率、画面分辨率、色彩深度、编码方式等诸多因素决定,是直接影响性能的重要因素。由于自适应带宽技术的存在,播放速率还受到网络环境的影响。c)再缓冲次数和时间。在播放过程中,缓冲区中的媒体数据耗尽,流媒体数据不能达到播放的要求,需要重新进行缓冲。再缓冲的时间和次数可以描述流媒体在播放过程中的质量,客观来讲,这是影响流媒体性能最重要的指标。d)帧率。人的眼睛由于生理原因会产生视觉停留,电影胶片就是利用这个原理。但是当每个画面停留时间过长时,眼睛就会觉察到不是连续的情景,这就意味着用户看到的是一个个画面,导致媒体的质量下降。3流媒体性能测量3.1实验平台以上讨论的均是能够反映流媒体性能的应用层指标。本文通过改变传输过程中的网络环境来研究能否使用这些指标评估流媒体性能。媒体播放器位于应用层,因此本文的应用层测量主要是从这些应用程序中提取流媒体的性能特征。实验采用RealNetworks公司的流媒体系统,包括流媒体服务器(HelixServer)、流媒体编码器(RealProducer)、流媒体播放器(RealPlayer)几部分,如表1所示。网络环境改变是利用NistNet来实现的。NistNet是运行在Linux下的IP网络环境模拟工具,可以把一台装有Linux的PC机作为路由器,从而达到改变网络环境的目的。NistNet能模拟包括可调包分发延迟、拥塞、带宽限制、包乱序等网络环境,这些都是影响流媒体性能的重要参数。实验中通过改变网络环境来观察应用层的流媒体性能改变。整个实验系统的结构如图2所示。流媒体服务器安装在HPProLiantML150;NistNet安装在一台普通的装有RedHatLinux的PC机上,内核为2.4.20-8,作为路由器,启动了路由功能;流媒体播放器安装在一台普通PC机上,操作系统为WindowsXP。利用RealProducerPlus编码器对一段长度为4min14s的MV进行两次编码作为媒体源,一次编码是单一比特率450kbps编码;一次是使用了SureStream技术的多比特率编码,分别为64、150、256、384、512kbps。3.2网络环境变化下的流媒体性能1)改变带宽带宽是影响流媒体性能最重要的因素之一,因此实验的第一个网络环境变化就是对带宽的改变。实验中,选取多比特率编码的MV作为媒体源。播放60s时,利用NistNet对带宽限制到240kbps,120s时恢复。其间观察媒体播放情况,并测量播放速率和帧率;实验重复20次,选取其中10次作为测量数据。播放速率变化如图3所示。从图中可看出,60s时,RealPlayer检测到可用带宽的改变,通知流媒体服务器改变发送的媒体服务速率,从原来的450降到150kbps左右。但是流媒体服务器检测到数据包丢失率较高,便继续降低发送的媒体服务速率,直到100kbps。带宽不足以播放最优质量流媒体时,媒体服务器除了降低媒体服务速率外,也会定期检测带宽。因此在120s带宽限制取消时,媒体服务器在140s左右检测到可用带宽增加,随即增加了媒体服务速率。60s改变带宽时,缓冲区内已经缓冲了一定带宽没有改变时的流媒体内容。因此当带宽改变后一定时间内播放器仍然在播放之前缓冲的内容,时间长度是由网络可用带宽和缓冲区大小决定的。从图4中可以看出,在90s时帧率明显下降,此时播放的内容就是带宽改变后流媒体服务器发过来的媒体数据;同样情况也出现在120s,带宽恢复后,仍然播放了大约60s缓冲区内的数据。在服务速率和帧率下降的过程中,接收端可明显感觉到画面质量下降。其中主要表现为画面分辨率降低、画面出现暂时停顿和跳跃等现象。由此可知,服务速率和帧率能够在一定程度上反映流媒体性能。在测量流媒体再缓冲概率实验中,为了避免SureStream的影响更改了流媒体源,使用的单一比特450kbps编码。为了控制流媒体播放器缓冲区的使用率,限制初始网络带宽为480kbps。实验中分别对带宽限速240kbps/1~10s,观察其RP(再缓冲的概率,rebufferingprobability),如图5所示。此时接收端画面会出现长时间停顿,严重影响了流媒体的服务性能,降低了媒体的可观赏性。2)改变丢包率和延迟流媒体技术中,丢失的数据包可以通过重发来弥补,但数据重发机制所能达到的效率很大一部分取决于路径延迟。实验中综合考虑丢包率p和延迟的影响,测量应用层流媒体服务质量。图6中分别对丢包率p从1%~15%、延迟为0和200ms,测量了流媒体播放速率。可以看出,丢包率为2%~6%,流媒体播放速率变化较大,并且与延迟的大小并无太大联系。丢包率的增加最主要的表现是媒体画面出现了马赛克,延迟的影响主要在播放前的缓冲阶段。实验中延迟为200ms时,当丢包率达到9%以上,出现了找不到媒体源的情况;丢包率到15%时,五次实验均未找到媒体源。这表明延迟太大会影响媒体播放器到服务器之间的消息响应。媒体服务器采用丢包后重发的机制,因此丢包率对应用层帧率和再缓冲概率影响均不大。实验中测得的在不同丢包率和延迟下,帧率几乎没有改变(图7),同样也没有再缓冲情况发生。4结束语本文介绍了一种面向应用层的流媒体性能测量的基本方法,引入了一套相应的评价指标,并利用实验验证了其有效性。与其他的流媒体性能评估方法相比,该测量方法与评价指标更能直观地反映观看者的感受,并且易于部署,测量具有独立性,是对现有方法的一种有益补充。
本文标题:面向应用层的流媒体性能测量指标
链接地址:https://www.777doc.com/doc-1485718 .html