您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 基于模糊控制的OTT视频质量评估方法
基于模糊控制的OTT视频质量评估方法刘辉寿国础信息与通信工程学院网络体系构建与融合北京市重点实验室北京邮电大学中国,北京摘要:关键字:一、引言随着信息时代的不断推进,新的多样性信息服务大量涌现,OTT(Overthetop)视频作为新兴的媒体形态在近段时间内迅猛发展,受到人们的广泛关注。据市场研究机构DigitalTVResearch的报告指出,全球OTT视频业务将在近几年快速发展,其中中国作为最大的智能终端存量市场,互联网电视用户数发展速度将领先全球,有望在2016年突破一亿,整个OTT视频产业收入也将会从2010年的5000万美元增长到2016年的13.8亿美元。OTT视频也由其开阔的市场和广泛的应用,被视为未来视频的主要发展方向。OTT视频通过因特网传输视频,与传统的IPTV不同,它不需要运营商提供专用网络或基础设施,而是通过普通的因特网数据协议和开放的因特网在非管理型的网络中传输,且用基于TCP的HTTP协议传输数据,便于管理的同时保证视频画面质量,较大程度的提高了用户体验。然而,OTT视频的运营在为人们带来便利的同时,也产生了一些问题。OTT视频通过因特网传输数据,TCP吞吐量由于网络中的各种损伤而受到影响。当TCP吞吐量比OTT视频播放速率小时,视频就会出现不间断的暂停现象,等待新的数据。这使得OTT视频的传输必须依赖于良好的网络性能。好的网络状态为用户带来高质量的视频体验,差的网络状态很大程度上影响用户视觉感受,用户体验质量QOE(QualityofExperience)也因此降低。随着OTT视频用户的不断增长,人们对视频QOE的要求也越来越高。为了满足用户需求,提高用户QOE,对OTT视频的质量进行评估和监测具有重大的意义。目前,网络视频质量的评估主要有两种方法:主观评估和客观评估。主观评估是通过人的视觉系统对视频的质量权衡和评估,这对视频质量的判定是决定性的。客观评估则是忽略人类视觉感知,通过算法和计算得出的智能评价结果,传统的客观评估方法有峰值信噪比(PSNR),结构相似度(SSIM),均方误差(MSE)等。主观评估和客观评估结果即用户QOE,一般是用平均意见MOS值表示,从1到5,“1”代表最差,“5”代表最好。针对网络视频的主观评估方法,主要通过若干组经过训练或未经训练的用户观看特定的视频内容,然后给出视频质量的评价结果。针对客观评估方法,相关学者提出了不同的算法和模型:[1]中提出了一种卷积神经网络客观评估视频的方法,通过训练达到自主评价视频质量的效果。[2]利用多元回归模型客观评估视频QOE,并同时考虑到视频和音频效果。[3]和[4]基于编解码器带来的视频画面扭曲给视频评估模型,而[5]和[6]则基于视频内容进行评估。[7]分析了人视觉接受视频图片的瞬间效果与视频质量感知之间的关系,瞬间效果相关指标由[8]给出建议。[9]探究了数据丢失对MPEG-2视频质量的影响,而MPEG-2和IPTV的感知质量的影响因素在[10]进行了描述。[11]通过实验探究网络QOS如何影响用户视觉感知质量。然而,这些方法或者只适合特定条件下的视频评估,或者只是专注于视频评估指标、用户视觉等某一方面的研究,对于新兴媒体形态OTT视频并不完全适用,所以需要我们寻求一种新的评估方法。在这篇论文中,结合OTT视频的特点,我们给出了一种基于模糊控制的质量评估方法,目的在于将模糊控制的原理用到OTT视频质量评估上,实现更加接近视觉感知的用户QOE。文章分析了网络层QOS、应用层QOS、到用户QOE之间的层次关系,选取每层的最重要的性能指标建立三层QOE模型。以网络层指标作为输入,利用映射层次映射关系,计算出应用层的QOS参数值,然后利用模糊算法,建立模糊控制模型,通过参数模糊化、模糊推理、清晰化等过程,输出最终的视频质量评估MOS值。论文的主要贡献主要分为两个方面:此前的网络视频客观评估研究大多集中在网络层QOS与应用层QOS的映射关系或指标探究方面,而忽略了应用层QOS到用户QOE的复杂关系和计算。本文利用模糊控制原理,在前人研究的基础上,详细的探讨了应用层QOS到用户QOE之间的映射,并计算出最终评估结果MOS值。其次,在模糊控制模型中,我们建立了应用层性能指标到MOS值的映射库,用于模糊控制器中,将计算机过与主观评估值实验数据对比,并利用Spearman和Pearson两种方法计算出得到高达“”的平均相似度,得出智能的评估结果。论文的第二部分介绍了模糊控制原理,详细分析了模糊控制器的功能和结构;第三部分简单分析了QOE三层模型的层析关系,然后建立模糊控制模型,计算模型的输入参数值,建立映射库,模糊控制分析、计算,输出最终MOS值,并通过主观评估实验数据进行相似度分析。第四部分得出结论。二、模糊控制原理模糊控制原理是基于模糊数学基本思想和理论的控制方法。控制领域里,控制系统动态模式的精确与否是影响控制优劣的最主要关键,系统动态的信息越详细,则越能达到精确控制的目的。然而,对于复杂的系统,由于变量太多,往往难以正确的描述系统的动态,于是便需要利用各种方法来简化系统动态,以达成控制的目的。传统的控制理论对于明确系统有强而有力的控制能力,但对于过于复杂或难以精确描述的系统,并不适用。因此人们便尝试着以模糊数学来处理这些控制问题。在这片论文中,我们所采用的模糊控制架构主要模糊化、模糊推理、清晰化、知识库等几个模块组成,在下面我们给出了模糊控制结构图。图中输入参数首先进入模糊化模块进行模糊处理,然后流入模糊推理模块,此模块是模糊控制的核心,接着进入对数据流清晰化处理,最后输出结果。在以上三个处理过程中,将分别需要知识库中提供的处理函数或规则表,对不同阶段的数据模糊控制。下面我们详细讨论模糊控制结构中的每一个环节。图1模糊控制结构图1.模糊化该模块的作用是将输入的精确量转换成模糊化量。其中输入量包括外界的参考输入、系统的输入或状态等。模糊化的具体过程如下:①首先对输入量进行过滤处理,将实际输入的数据变为符合下一步要求的输入量。②将上述已经处理过的输入量进行尺度变换,使其变换到各自的论域范围。论域可以是连续的也可以是离散的。如果要求离散的论域,则需要将连续的论域离散化或量化。③将上述已经处理过的输入量进行模糊处理,使原来精确的输入量编程模糊的输入量,并用相应的模糊集合来表示。2.知识库知识库中包含了具体应用领域中的知识和要求的控制目标。它通常由数据库和模糊控制规则库两部分组成。①数据库主要包括各变量的隶属度函数,尺度变换因子以及模糊空间的分级数等。利用数据库可以将输入和输出空间模糊分割,并计算出实际数据针对每个分割空间的隶属度,通过隶属度的比对得出数据等级。②规则库包括了用模糊语言变量表示的一系列控制规则,通常为如下形式:IF(满足一组条件)THEN(推出一组结论)它们是模糊推理的根据。IF-THEN规则中的前提和结论均是模糊的概念,因此也称它为模糊条件句。规则库的建立有多种方法,包括基于专家经验和控制工程知识、基于过程的模糊模型、基于学习等,在此篇论文中,我们采用了基于操作人员的实际操作过程制定规则表。3.模糊推理模糊推理是模糊控制最重要的部分,它具有模拟人的基于模糊概念的推理能力。该推理知识库模糊化模糊推理清晰化输入参数输出过程是基于模糊逻辑中的蕴含关系及推理规则来进行的。模糊推理的过程也是模糊控制的过程,目前主要包括两种形式:①状态评估的模糊推理,它具有如下的形式:R1:如果x是A1andy是B1,则z是C1R2:如果x是A2andy是B2,则z是C2...R3:如果x是Anandy是Bn,则z是Cn现有的模糊控制系统中,大多数情况均采用这种形式,在我们的论文中也采用此种控制规则。②目标评估的模糊推理,典型的形式如下:Ri:如果[u是Ci-(x是Ai,andy是Bi)],则u是Ci其中u是系统的控制量,x和y系统性能的评估参数,x和y的取值均为“好”,“差”等模糊语言。对于每个控制命令Ci,通过预测相应的结果(x,y),从中选用最适合的推理规则。4.清晰化清晰化的作用是将模糊推理得到的控制量(模糊量)变换为实际用于控制的清晰量。它包含两部分内容:①将模糊的控制量经清晰化变换变成表示在论域范围的清晰量。②将表示在论域范围的清晰量经尺度变换变成实际的控制量。清晰化计算通常包括三种计算方法:最大隶属度法、中位数法、加权平均法。在本文中,根据研究对象特点,我们采用加权平均法。加权平均法是取控制量的加权平均值作为清晰值,对于论域连续的情况有:𝑍0=𝑑f(z)=∫𝑧μ(z)dz𝑏𝑎∫𝜇(z)dz𝑏𝑎,其中,z为模糊的控制量,μ(z)为加权函数。对于论域离散的情况有:𝑍0=∑𝑧𝑖μ(𝑧𝑖)𝑛𝑖=1∑μ(𝑧𝑖)𝑛𝑖=1,其中,z为模糊的控制量,μ(z)为加权函数。清晰化计算后,即得出我们最终所需要的评估值。三、评估模型的建立与分析1.OTT视频QOE的三层架构OTT视频质量受到不同层面的多种因素的影响,从应用层来讲,视频的缓冲程度,缓冲时间长短等因素直接给用户体验带来影响。从网络层面来讲,网络状况的好坏影响视频流的数据传输,从而带来应用层指标参数的变化。因此,为了更清晰的了解OTT视频QOE的影响因素与层次关系,我们建立了OTT视频的三层QOE架构,如图2所示。图2三层QOE架构针对应用层,我们选取初始播放时延,缓冲频率和平均缓冲时间作为应用层的用户QOE影响指标。初始缓冲时间是指用户从点击视频播放至视频开始播放的时间;缓冲频率指视频在播单位时间内缓冲的次数;平均缓冲时间为视频整个播放过程中因再缓冲而等待的平均时长。它们直接关系到用户的视觉效果和内在感受,因此直接决定用户QOE。针对网络层,网络带宽、往返时延和丢包率是该层的三个主要特性指标,它们可以反映网络状况的好坏,影响数据传输速率以及吞吐量大小,进而造成应用层特性指标的变化,影响用户QOE。下面我们从网络层入手,建立网络特性指标与应用层指标关系,并通过已知的网络特性指标值计算出对应的应用层性能指标值。然后建立模糊控制模型,将应用层性能指标作为输入,经过模糊化、模糊推理、清晰化等分析过程,计算OTT视频客观评估值MOS。2.网络层指标到应用层指标的计算网络层指标网络带宽、丢包率、往返时延直接影响着应用层指标的变化,在此,我们建立了一个从网络层到应用层参数映射的简单模型。映射模型基于以下4条假设:①视频在下载过程中网络带宽、往返时延、丢包率为恒定值。②视频播放的过程中,用户用户QOE初始缓冲时间缓冲频率平均缓冲时间网络带宽丢包率往返时延应用层网络层不对视频进行任何操作。③服务器与客户端之间的数据平均比特率为恒定值。④视频的比特率没有大幅度的波动。⑤视频的缓存容量要小于视频的大小,且在视频初始缓冲和再缓冲时,只有缓存被填满后才能播放。(1)初始缓冲时间初始缓冲时间为用户发出视频请求至视频开始播放的等待时间,它与以下几个因素有关:视频缓存容量,视频播放速率,视频数据流传输的平均TCP吞吐量。因此我们可以从3.1式可以得出视频初始缓冲时间𝑇初始:𝑇初始=𝐵满×𝑆播放𝐺平均(3.1)其中,𝐵满表示视频缓冲容量的大小,𝑆播放表示视频的播放速率,𝐺平均表示视频数据流传输的平均TCP吞吐量。𝐺平均可以通过包传输速率𝑠包发送(p)的计算[21],然后进一步由3.3式求得:𝑠包发送(p)=1𝑅√2𝑏p3+𝑇0min(1,3√3𝑏𝑝8)p(1+32𝑝2)(3.2)𝐺平均=𝑠包发送(p)×M×8/R(3.3)其中,𝑠包发送(p)表示每个往返时延的包发送速率,p表示丢包率,b表示通过一个ACK获得的包数量,R表示往返时延,𝑇0表示重传超时时间,M表示由服务发送的数据包的大小。(2)缓冲频率缓冲频率的计算涉及到视频时间长度以及视频播放过程中缓冲次数两个因素。视频时间长度在视频打开后即可得知,而缓冲次数需要利用视频播放剩余时间长度和每次触发缓冲前视频的播放时间求得。𝐹缓冲={0,如果𝐺平均≥𝑆播放𝑁缓冲𝐿,否则(3.4)
本文标题:基于模糊控制的OTT视频质量评估方法
链接地址:https://www.777doc.com/doc-2575626 .html