您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 数字电视原理09_第九章_数字音频技术
第九章数字音频技术中国民航大学电子信息工程学院天津市智能信号与图像处理重点实验室王晓亮wxl_ee@126.com2电子信息工程学院数字电视原理第九章数字音频技术9.1人耳听觉特性9.2音频压缩编码思路9.3MPEG-1音频压缩技术9.4MPEG-2音频压缩技术9.5DolbyAC-3音频压缩技术9.6其它音频编码标准3电子信息工程学院数字电视原理9.1人耳听觉特性人耳能听到的频率范围为20Hz~20kHz声音的客观强弱由声强(单位:W/cm2)或声压级(单位:dB)描述人耳对声音强弱的主观感觉用响度描述,与客观实际强度不一致人耳听到的声音响度与声音频率有关4电子信息工程学院数字电视原理9.1人耳听觉特性最下方曲线称“零方等响度级”曲线或“绝对听阈”曲线,即在安静环境中,能被人耳听到的纯音的最小值最上方曲线为声音大到使人耳感到疼痛的阈值,该阈值称为“痛阈”等响度曲线5电子信息工程学院数字电视原理9.1人耳听觉特性人耳对不同频率的敏感程度差别很大,其中对2kHz~4kHz范围的信号最为敏感,幅度很低的信号都能被人耳听到。而在低频区和高频区,能被人耳听到的信号幅度要高得多6电子信息工程学院数字电视原理9.1人耳听觉特性掩蔽效应一种频率的声音阻碍听觉系统感受另一种频率的声音的现象称为掩蔽效应。前者称为掩蔽声音(maskingtone),后者称为被掩蔽声音(maskedtone)掩蔽可分成频域掩蔽和时域掩蔽1.频域掩蔽•一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽(simultaneousmasking)7电子信息工程学院数字电视原理9.1人耳听觉特性8电子信息工程学院数字电视原理9.1人耳听觉特性声强为60dB、频率为1000Hz纯音的掩蔽效应9电子信息工程学院数字电视原理9.1人耳听觉特性频率为250Hz、1kHz、4kHz和8kHz纯音的掩蔽效应,它们的声强均为60dB①在250Hz、1kHz、4kHz和8kHz纯音附近,对其他纯音的掩蔽效果最明显②低频纯音可以有效地掩蔽高频纯音,但高频纯音对低频纯音的掩蔽作用则不明显10电子信息工程学院数字电视原理9.1人耳听觉特性2.时域掩蔽时间上相邻的声音之间也有掩蔽现象,并且称为时域掩蔽。时域掩蔽又分为超前掩蔽(pre-masking)和滞后掩蔽(post-masking)超前掩蔽较短,只有大约5~20ms,而滞后掩蔽可以持续50~200ms11电子信息工程学院数字电视原理9.1人耳听觉特性时域掩蔽12电子信息工程学院数字电视原理第九章数字音频技术9.1人耳听觉特性9.2音频压缩编码思路9.3MPEG-1音频压缩技术9.4MPEG-2音频压缩技术9.5DolbyAC-3音频压缩技术9.6其它音频编码标准13电子信息工程学院数字电视原理9.2音频压缩编码思路1.根据听觉域度对可闻信号进行编码听觉域度对编码的作用14电子信息工程学院数字电视原理9.2音频压缩编码思路2.根据掩蔽效应,只对幅度强的掩蔽信号进行编码15电子信息工程学院数字电视原理9.2音频压缩编码思路3.量化噪声使得不必全部编码原始信号16电子信息工程学院数字电视原理9.2音频压缩编码思路4.通过子带分割来进行优化、编码子带编码、优化17电子信息工程学院数字电视原理第九章数字音频技术9.1人耳听觉特性9.2音频压缩编码思路9.3MPEG-1音频压缩技术9.4MPEG-2音频压缩技术9.5DolbyAC-3音频压缩技术9.6其它音频编码标准18电子信息工程学院数字电视原理9.3MPEG-1音频压缩技术MPEG-1音频压缩的的主要依据是人耳朵的听觉特性,使用“心理声学模型(psychoacousticmodel)”来达到压缩声音数据的目的心理声学模型①听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到,因此就可以把这部分信号去掉•听觉阈值的大小随声音频率的改变而改变,各个人的听觉阈值也不同。大多数人的听觉系统对2kHz~5kHz之间的声音最敏感。一个人是否能听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值19电子信息工程学院数字电视原理9.3MPEG-1音频压缩技术②听觉系统存在掩蔽特性,听觉阈值电平是自适应的,即听觉阈值电平会随听到的不同频率的音频而发生变化•例如,同时有两种频率的音频存在,一种是1000Hz的音频,另一种是1100Hz的音频,但它的强度比前者低18分贝,在这种情况下,1100Hz的音频就听不到20电子信息工程学院数字电视原理9.3MPEG-1音频压缩技术MPEG-1音频压缩算法框图21电子信息工程学院数字电视原理9.3MPEG-1音频压缩技术MPEG-1音频压缩标准的主要性能:(1)输入信号为线性PCM信号,采样率为32,44.1或48kHz,输出为32kb/s~384kb/s(2)MPEG-1音频压缩标准提供三个独立的压缩层次①层1的编码器最为简单,编码器的输出数据率为384kb/s,主要用于小型数字盒式磁带(digitalcompactcassette,DCC)②层2的编码器的复杂程度属中等,编码器的输出数据率为256kb/s~192kb/s,其应用包括数字音频广播(DAB)、数字音乐、CD-I(compactdisc-interactive)和VCD(videocompactdisc)等③层3的编码器最为复杂,编码器的输出数据率为64kb/s,主要应用于网络音乐22电子信息工程学院数字电视原理9.3MPEG-1音频压缩技术1.子带编码滤波器组的划分MPEG-1音频编码器把输入信号变换到32个频域子带中去。子带的划分方法有两种,一种是线性划分,另一种是非线性划分23电子信息工程学院数字电视原理9.3MPEG-1音频压缩技术2.编码层MPEG音频压缩定义了3个层次,它们的基本模型是相同的。层1是最基础的,层2和层3都在层1的基础上有所提高。每个后继的层次都有更高的压缩比,但需要更复杂的编码解码器MPEG的音频数据分成帧(frame),层1每帧包含384个样本的数据,每帧由32个子带分别输出的12个样本组成。层2和层3每帧为1152个样本24电子信息工程学院数字电视原理9.3MPEG-1音频压缩技术层1、2和层3的子带样本25电子信息工程学院数字电视原理9.3MPEG-1音频压缩技术MPEG编码层简介层1:采用均匀子带划分,心理声学模型仅使用频域掩蔽特性层2:采用均匀子带划分,心理声学模型除使用频域掩蔽特性外还利用了时域掩蔽特性,并且在低、中和高频段对比特分配作了一些限制,对比特分配,比例因子和量化样本值的编码也更紧凑层3:采用非均匀子带划分,即临界频带划分,心理声学模型使用频域和时域掩蔽,同时还考虑了立体声数据冗余,并且使用了Huffman编码26电子信息工程学院数字电视原理9.3MPEG-1音频压缩技术MPEG-1音频信号数据压缩过程(a)时间/频率映射(滤波器组)用以将输入的信号转化为亚取样的频谱分量分为子带(b)频域滤波器组或并行变换的输出,根据心理声学模型求出时变的掩蔽门限估值(c)按量化噪声不超过掩蔽门限的原则将子带量化编码以使量化噪声不可听到(d)按帧打包成码流(包括比特分配信息)27电子信息工程学院数字电视原理第九章数字音频技术9.1人耳听觉特性9.2音频压缩编码思路9.3MPEG-1音频压缩技术9.4MPEG-2音频压缩技术9.5DolbyAC-3音频压缩技术9.6其它音频编码标准28电子信息工程学院数字电视原理9.4MPEG-2音频压缩技术MPEG-2声音编码标准是MPEG为多声道声音开发的低码率编码方案,它是在MPEG-1声音标准基础上发展而来的。和MPEG-1相比,MPEG-2声音主要增加了三个方面的内容(1)支持5.1路环绕声。它能提供5个全带宽声道(左、右、中和两个环绕声道),外加一个低频效果增强声道,统称为5.1声道(2)支持多达8种语言或解说(3)增加了低取样和低码率。在保持MPEG-1声音的单声道和立体声的原有取样率的情况下,MPEG-2又增加了三种取样率,即把MPEG-1的取样率降低了一半,(16kHz,22.05kHz,24kHz)以便提高码率低于64kbit/s时的每个声道的声音质量29电子信息工程学院数字电视原理9.4MPEG-2音频压缩技术MPEG-2的两种音频数据压缩格式MPEG-2Audio,或者称为MPEG-2多通道(Multichannel)音频,与MPEG-1Audio兼容,所以又称为MPEG-2BC(BackwardCompatible)MPEG-2AAC(AdvancedAudioCoding),与MPEG-1声音格式不兼容,因此通常称为非后向兼容MPEG-2NBC(Non-Backward-Compatible)标准30电子信息工程学院数字电视原理9.4MPEG-2音频压缩技术MPEG-2Audio(ISO/IEC13818-3)和MPEG-1Audio(ISO/IEC1117-3)标准都使用相同种类的编译码器,LayerⅠ,LayerⅡ和LayerⅢ的结构也相同MPEG-2音频标准与MPEG-1标准相比,MPEG-2做了如下扩充:①增加了16kHz,22.05kHz和24kHz采样频率②扩展了编码器的输出速率范围,由32~384kbit/s扩展到8~640kbit/s③增加了声道数,支持5.1声道和7.1声道的环绕声。此外MPEG-2还支持LinearPCM(线性PCM)和DolbyAC-3(AudioCodeNumber3)编码31电子信息工程学院数字电视原理9.4MPEG-2音频压缩技术MPEG-1和MPEG-2的声音数据规格32电子信息工程学院数字电视原理9.4MPEG-2音频压缩技术MPEG-2Audio的“5.1环绕声”MPEG-2Audio的“5.1环绕声”也称为“3/2/.1立体声加LFE”,其中的“.1”就是指LFE声道。它的含义是播音现场的前面可有3个喇叭声道(左、中、右),后面可有2个环绕声喇叭声道,LFE(lowfrequencyeffects)是低频音效的加强声道33电子信息工程学院数字电视原理9.4MPEG-2音频压缩技术5.1声道最佳效果放置5个全频带的重放扬声器分为前置扬声器(包括L、R、C)和后置扬声器(也称环绕扬声器,包括Ls、Rs),分别位于一个圆的边界上,其中L、R扬声器与C扬声器分别呈30度夹角,Ls、Rs扬声器与C扬声器分别呈110度夹角。低频增强声道,称之为LFE,它的频率范围在200Hz以下,大约是全频带倍频程的10%左右,因此也称点一声道。34电子信息工程学院数字电视原理9.4MPEG-2音频压缩技术7.1声道环绕立体声35电子信息工程学院数字电视原理9.4MPEG-2音频压缩技术MPEG-1、MPEG-2音频参数的比较36电子信息工程学院数字电视原理9.4MPEG-2音频压缩技术MPEG-2中的AAC编码AAC:AdvancedAudioCoding先进音频编码,不向下兼容MPEG-2AAC是声音感知编码标准,MPEG-2AAC主要使用听觉系统的掩蔽特性来减少声音的数据量,并且通过把量化噪声分散到各个子带中,用全局信号把噪声掩蔽掉。与MPEG的LagerⅡ相比,MPEG-2AAC的压缩率可提高1倍,而且质量更高,与MPEG的LagerⅢ相比,在质量相同的条件下数据率是它的70%。37电子信息工程学院数字电视原理第九章数字音频技术9.1人耳听觉特性9.2音频压缩编码思路9.3MPEG-1音频压缩技术9.4MPEG-2音频压缩技术9.5DolbyAC-3音频压缩技术9.6其它音频编码标准38电子信息工程学院数字电视原理9.5DolbyAC-3音频压缩技术杜比AC-3环绕声系统AC(AudioCoding)-3是一种播放高音质和效果的环绕声系统杜比AC-3系统利用心理声学原理对音频信号进行压缩编码其取样频率有32KHz、44.1
本文标题:数字电视原理09_第九章_数字音频技术
链接地址:https://www.777doc.com/doc-1479073 .html