您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 国内外标准规范 > GAT669.4-2008视音频编解码技术要求
公安部科技信息化局全国安全防范报警系统标准化技术委员会GA/T669.4-2008城市监控报警联网系统技术标准第4部分:视音频编、解码技术要求《城市监控报警联网系统系列标准》教师宣贯培训第一章范围本章规定了GA/T669.4-2008《城市监控报警联网系统技术标准第4部分:视音频编、解码技术要求》的基本内容和适用范围。•1范围GA/T669的本部分规定了城市监控报警联网系统(以下简称“联网系统”)视音频编码、解码的技术要求,包括总体技术要求、视频编、解码技术要求、音频编、解码技术要求、视音频传输格式、视音频存储格式等。本部分适用于城市监控报警联网系统,其他领域的监控报警联网系统可参考采用。【条文解释】“城市监控报警联网系统视音频编、解码技术要求”是城市监控报警联网系统工程建设中的重要技术文件,以城市监控报警联网系统中视音频互联互通为目的,主要从视音频编解码、网络传输和存储三个层次对城市监控报警联网系统中视、音频编解码技术提出了基本技术要求。与H.264、MPEG-4等视音频编解码标准相比,该技术要求并不详细描述具体的编解码细节,而是规范了如何在城市监控报警联网系统中应用相关的视音频编解码标准,达到既能实现媒体的互联互通,又兼顾监控行业视音频技术发展现状的目的。该标准虽然不是强制性标准,但按照行政法规和规章的相关规定,它对监控报警联网系统中视音频编解码技术的应用仍然具有很强的约束力和规范作用。第二章规范性引用文件本章列出了GA/T669.4-2008《城市监控报警联网系统技术标准第4部分:视音频编、解码技术要求》引用的相关标准、文件。2规范性引用文件下列文件中的条款通过GA/T669的本部分的引用而成为本部分的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本部分,然而,鼓励根据本部分达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本部分。•GA/T669.1-2006城市监控报警联网系统技术标准第1部分:通用技术要求•ISO/IEC13818-1:2000信息技术运动图像和伴音信息的通用编码第1部分:系统•ISO/IEC14496-2:2004信息技术视听对象编码第2部分:视频•ISO/IEC14496-2:2004/Amd.2:2005信息技术视听对象编码第2部分:视频/修订稿2:简单档次的新级别•ISO/IEC14496-4:2004信息技术视听对象编码第4部分:一致性测试•ISO/IEC14496-4:2004/Amd.10:2005信息技术视听对象编码第4部分:一致性测试/修订稿10:简单档次中级别L4a、L5的一致性扩展•ITU-TRec.G.711-1988数字传输系统的通用部分:音频的脉冲编码调制•ITU-TRec.G.723.1-1996数字传输系统的通用部分:5.3和6.3kbit的多媒体通信传输中的双速率语音编码器•ITU-TRec.G.729-1996数字传输系统的通用部分:利用共轭结构代数码激励线形预测的8kbit/s语音编码•ITU-TRec.H.264-2005H系列:音视频和多媒体系统,音视频服务基础-活动视频编码:通用音视频服务的先进视频编码•ITU-TRec.H.264.1-2005H系列:音视频和多媒体系统,音视频服务基础-活动视频编码:H.264先进视频编码的一致性说明•RFC3016用于MPEG-4音频/视频流的RTP负载格式•RFC3550RTP:一种实时应用的传输协议•RFC3984H.264视频的RTP负载格式【条文解释】本部分只列出了编写该技术要求时直接引用的相关文件。除此外,还借鉴了其他一系列相关文件,但技术要求中并未直接引用,将其中的主要几个文件列于技术要求的参考文献中。第三章术语、定义和缩略语•本章列出了GA/T669.4-2008《城市监控报警联网系统技术标准第4部分:视音频编、解码技术要求》中所用到的基本术语、定义和缩略语。•GA/T669.1-2008《城市监控报警联网系统技术标准第1部分:通用技术要求》中列出的术语、定义和缩略语也适用于本部分,因此直接引用而未在本部分列出。3术语、定义和缩略语GA/T669.1-2006确立的以及下列术语、定义和缩略语适用于本部分。3.1术语和定义3.1.1编码器encoder实现编码过程的实体,可以为软件或硬件。【条文解释】从处理媒体的种类角度编码器可以分为视频编码器和音频编码器,从实物表现形态角度编码器又可以分为软件编码器和硬件编码器。编码器中包含视频或音频编码算法的实现,编码器的输入为模拟视频或音频信号,经过编码器的处理后输出压缩的视频或音频数字码流。3.1.2解码器decoder实现解码过程的实体,可以为软件或硬件。【条文解释】从处理媒体的种类角度解码器可以分为视频解码器和音频解码器,从实物表现形态角度解码器又可以分为软件解码器和硬件解码器。解码器中包含视频或音频解码算法的实现,解码器的输入为压缩的视频或音频数字码流,经过解码器的处理后输出可以直接显示或播放的视频或音频信号。3.1.3档次profileH.264或MPEG-4视频编解码标准中规定的整个比特流语法的子集,描述了对比特流的限制以及满足该档次的解码器应遵从的算法特征和限制。【条文解释】进行H.264和MPEG-4视频编码或解码时会应用到多种具体算法,H.264和MPEG-4视频编解码标准中,根据实现编解码采用的具体算法不同划分出不同的比特流档次,每一种档次都与一组具体的算法相对应,以适用于不同的应用场景。比如,H.264视频编解码标准中就划分为基本档次、主档次、扩展档次等等。3.1.4级别level视频编码比特流中句法元素参数值的限制集合,一个档次可以包括一个或若干个级别。【条文解释】级别是对档次的细分。一个档次中,会根据支持的分辨率大小等因素细分为若干级别。3.1.5一致性测试conformancetesting验证比特流和解码器是否满足相应标准规定的测试。【条文解释】简言之,一致性测试是指验证比特流或解码器是否与相应标准规定一致的测试,一致性测试一般都与特定的档次和级别相关联。一致性测试可分为比特流一致性测试和解码器一致性测试,比特流一致性测试是指为验证比特流是否确实是所标称的特定档次和级别的标准比特流所做的测试。同理,解码器一致性测试则是指为验证解码器是否确实能解码特定档次和级别的标准比特流所做的测试。3.1.6比特流/码流bitstream描述图像或声音编码的一种有序的二进制数据组合。3.1.7基本档次baselineprofileH.264视频标准(ITU-TRec.H.264-2005)中定义的一个档次,是该标准中基本的档次。3.1.8简单档次simpleprofileMPEG-4视频标准(ISO/IEC14496-2:2004)中定义的一个档次,是该标准中基本的档次。3.2缩略语(略)第四章视音频编、解码的总体技术要求本章规定了为实现联网系统中媒体信息的互联互通视音频编、解码技术应满足的基本要求。包括对视音频编、解码标准的选择,以及视频图像的分辨率、媒体流传输协议、码率控制等方面的总体技术要求。4视音频编、解码的总体技术要求4.1综述本部分仅规定了实现联网系统中互联互通视音频编、解码技术应满足的基本要求。在不影响互联互通的情况下,本部分不限制使用方根据需要采用其它适合的视音频编、解码标准或工具。联网系统中的视音频流原则上不应包含私有数据格式。若确有必要加入私有数据,则应不影响该视音频编、解码器的性能及其与相应标准视音频编、解码器间的互通性。【条文解释】“私有”与“标准”是相互对立的。随意在视音频码流中增加私有的数据格式将会对城市监控报警联网系统中的媒体流互联互通带来非常严重的影响,因此该技术要求规定视音频流原则上不应包含私有数据格式。但并非绝对禁止,考虑到不同媒体设备制造商的具体需求,若确有必要加入私有数据时,一定要进行完善的一致性测试,以便不影响其与标准视音频编、解码器间的互通性和编解码器的使用性能。4.2视音频编、解码标准选择视频编码应支持H.264或MPEG-4视频编码标准,视频解码应同时支持H.264和MPEG-4视频解码标准。对上述两种视频编/解码标准的具体要求详见第5章。【条文解释】从计算复杂度来讲,视频编码的复杂度要远高于解码复杂度,而且目前安防行业中很少有能同时支持H.264和MPEG-4视频编码标准的视频编码器;视频解码器的计算复杂度相对较低,可以实现在同一个解码终端同时对H.264和MPEG-4视频流进行解码。而且在实际应用中,往往是同一个解码终端对应诸多的编码器,因此对于联网系统中视频流的互联互通而言,规定视频解码器适应较多种类的视频格式是切实可行的有效途径。音频编码应支持ITU-TRec.G.711-1988或ITU-TRec.G.723.1-1996或ITU-TRec.G.729-1996音频编码标准,音频解码应同时支持ITU-TRec.G.711-1988、ITU-TRec.G.723.1-1996和ITU-TRec.G.729-1996音频解码标准,可扩展支持ITU-TRec.G.722.1-1999音频解码标准。对上述音频编、解码标准的具体要求详见第6章。【条文解释】音频编解码的计算复杂度远远低于视频编解码。在实际应用中,往往是同一个音频解码终端对应诸多的音频编码器,因此对于联网系统中音频流的互联互通而言,规定音频解码器适应较多种类的音频格式是切实可行的有效途径。在适用于安防视频监控领域的SVAC视音频标准发布后,宜优先采用。【条文解释】目前我国正在制定的适用于安防视频监控领域的视音频编解码标准名称是SVAC(SurveillanceVideoAudioCoding:安全防范视频监控数字音视频编解码技术要求)。标准颁布后,宜优先采用。4.3视频图像分辨率编码、传输和存储的图像数据应具有不低于CIF(352×288)格式的图像分辨率,重要目标和报警图像宜具有不低于4CIF(704×576)格式的图像分辨率。【条文解释】较高的图像分辨率更有利于图像使用人员准确分析和判断图像场景的内容。在条件允许的情况下,城市监控报警联网系统中编码、传输和存储的图像数据应尽量使用不低于4CIF(704×576)的图像分辨率。4.4视音频流的传输协议采用RTP协议(RFC3550)在IP网络上传输视音频流,不同视音频流的RTP打包格式详见第5、6章中的相关规定。4.5码率控制宜支持CBR/VBR两种码率控制方式。【条文解释】•CBR即固定码率,优点是压缩快,缺点是占用空间相对大,编码内容的质量不稳定。当网络带宽紧张时宜采用CBR方式编码。•VBR即可变码率,当强调画面质量且网络带宽充裕的情况下宜采用VBR方式编码。•城市监控报警联网系统中的视频编码器宜支持CBR/VBR两种码率控制方式,以适应不同的需求。第五章视频编、解码技术要求本章规定了城市监控报警联网系统中H.264、MPEG-4视频编解码及一致性测试的具体要求。5视频编、解码技术要求5.1基于H.264的视频编/解码技术要求本部分规定了城市监控报警联网系统中H.264视频编解码的具体技术要求。包括H.264档次和级别的技术要求、基本档次的码流语法技术要求,以及一致性测试技术要求等几方面的内容。5.1.1H.264的档次和级别采用H.264标准的视频编码应至少支持ITU-TRec.H.264-2005的基本档次(BaselineProfile),级别(Level)应至少支持到Level1.3,宜扩展支持到Level3;视频解码所支持的档次和级别应不低于编码支持的最高档次和级别,至少应支持到H.264基本档次的Level3;视频解码宜扩展支持H.264主档次(MainProfile)中的隔行扫描和B帧工具,且相邻两P帧间的B帧个数不大于2。【条文解释】•H.264视频编码基本档次的Level1.3级别:相当于采用CIF(352×288)分辨率进行视频编码时,帧率可以达到30.0帧/秒;基本档次的L
本文标题:GAT669.4-2008视音频编解码技术要求
链接地址:https://www.777doc.com/doc-5496843 .html