您好,欢迎访问三七文档
3.5音频信息压缩编码技术的标准体系3.5.2混合编码标准MPEG音频编码标准3.5.4DolbyAC-33.5.33.5.2混合编码标准01020304G.728标准G.729标准G.723.1标准GSM标准3.5.2混合编码标准01G.728标准用途:IP电话网中,低速率的ISDN可视电话的推存语音编码01算法:低时延码激励线形预测算法(LD-CELP)02特点:算法时间短(0.625ms)、编码延时小于2ms、低比特速率的标准(16kb/s)、MOS评分可达4.1分033.5.2混合编码标准02G.729标准用途:个人移动通信、低轨道卫星通信系统等01算法:共轭结构代数码激励线形预测算法(CS-ACELP)02特点:低码速率的语音压缩标准,码率为8kb/s,算法复杂033.5.2混合编码标准02G.729标准CS-ACELP编码器建立在码本激励的模型的基础上,8kHz采样信号每10ms为一帧(80个样本),按帧计算CELP模型参数,将这些参数编码、传送。解码器将接收到的参数解码,得到激励和合成滤波器参数。激励信号经过短时合成滤波器滤波得到重构语音信号,其中短时合成滤波器为10阶LP滤波器,长时滤波器为自适应码本滤波器。为了在听觉不敏感频域对噪声进行抑制,重构语音还需经过后滤波器处理。04053.5.2混合编码标准03G.723.1标准用途:用于各种网络环境中低码率的多媒体通信中01算法:5.3kb/s码率编码器采用多脉冲最大似然量化技术(MP-MLQ),6.3kb/s码率编码器采用代数码激励线性预测技术(ACELP)02特点:低码率,MOS达到3.5033.5.2混合编码标准04GSM用途:欧洲采用的移动电话压缩标准01算法:长时预测规则码激励算法02特点:采样频率为8kHz,码率为13kb/s,MOS达3.8033.5.2混合编码标准04GSMGSM是帧输入数据,一帧(20ms)采样频率8kHz、带符号的160样本组成。每个样本13位或16位的线性PCM码。GSM编码器把一帧数据压缩成260位的GSM帧。压缩后的数据率为1625字节,相当于13kb/s。由于260为不是8的整数倍,因此编码器输出GSM帧为264位的线性PCM码。未压缩:8000×16=128kb/s压缩后:压缩比:128/13.2=9.7,近似于10:10413.2kb/s160/s8000264样本样本位3.5.3MPEG音频编码标准01020304MPEG-1AudioMPEG-2AudioMPEG-2AACMPEG-4AudioMPEG声音压缩编码是利用人的听觉特性来达到压缩声音数据的目的(感知编码).3.5.3MPEG音频编码标准01MPEG-1Audio编码对象:20Hz~20KHz带宽的音频信号01采样频率:32KHz、44.1KHz、48KHz02编码算法:感知子带编码03MPEG-1定义3个独立的压缩层次,用于表示不同的压缩算法,分别为:第一层—MP1、第二层—MP2和第三层—MP3043.5.3MPEG音频编码标准01MPEG-1AudioMPEG采用子带编码,共分为32个子带06帧传输,每帧独立解码07层次增加,算法难度加大,分级向下级兼容05MPEG编码层次压缩比编码速率比kb/s应用第一层4:1384小型数字盒式磁带第二层6:1~8:1256~192数字音乐、只读光盘交互系统和视盘第三层10:1~12:1128~112ISDN上的声音传输3.5.3MPEG音频编码标准01MPEG-1AudioMP1对一个子带中的1个样本组编码,32个子带分别输出12个样本组,则样本数据:32×12=384MP2&MP3对一个子带中的3个样本组编码,则样本数据:32×3×12=1152083.5.3MPEG音频编码标准MPEG-1Audio--MP1A分析滤波器组:将数字化的宽带音频信号分为32个子带每个子带的宽度为625Hz;采用与DCT类似的算法对输入信号进行变换FFT:对输入信号进行频谱分析掩蔽阀值:根据信号的频率、强度和音调计算出各个子带的掩蔽阀值;然后将各个子带的掩蔽阀值合成为全局的掩蔽阀值SMR:全局掩蔽阀值与最大信号比较,得到信掩比SMR线性量化器:检测每个子带样本,找出这些样本中的最大绝对值,然后量化成6位,得到比例因子。动态比特和比例因子分配器以及编码器根据SMR确定每个子带的比特分配,子带样本按照比特分配数进行量化和编码。对被高度掩蔽的子带不需进行编码。多路复合器MUX:它按照规定的帧格式将声音样本和编码信息(包括位分配和比例因子)进行包装,将它们封装成帧。←3.5.3MPEG音频编码标准MPEG-1Audio--MP1A用于同步和记录该帧信息,长度为32位。MPEG-1音频标准的所有三层在这部分都是一样的。用于检查是否有错误的循环冗余码(CRC),长度为16位。所有三层在这部分也是相同的。用于描述位分配的域,长度为4位。比例因子域,长度为6位。是每帧中的最大部分,不同层是不一样的。有可能添加的附加数据域,长度未规定。3.5.3MPEG音频编码标准MPEG-1Audio--MP2A1)第2层编码:频域掩蔽特性+时域掩蔽特性变带宽划分子带2)在低频、中频和高频段对位分配做了一些限制:低频段使用4位、中频段使用3位、高频段使用2位。3)对位分配、比例因子和量化样本值的编码也更紧凑。相同:同步头和CRC结构不同点:描述位分配的位数随子带不同而变化;另外,第2层位流中有一个2位的比例因子选择信息(SCFSI)域,解码器根据这个域的信息就可以知道是否需要以及如何共享比例因子。3.5.3MPEG音频编码标准MPEG-1Audio--MP3A1)采用变带宽子带划分。除了利用时域和频域掩蔽特性外,还考虑了立体声数据的冗余,并且采用了霍夫曼编码器。2)第3层编码采用的滤波器组在原有的基础上,采用了改进离散余弦变换(MDCT),对第1层/第2层滤波器组的不足进行补偿。3)MDCT将子带的输出在频域进一步细分,以达到更高的频域分辨率。通过对子带的进一步细分,第3层编码器还可以部分消除由多相滤波组引入的混叠效应。4)第3层指定了两种MDCT的块长:18个样本组成的长块长和6个样本组成的短块长。3个短块长刚好等于1个长块长。对于给定的一帧样本信号,MDCT可以全部使用长块或全部使用短块,也可以长短块混合使用。对于平稳信号,使用长块可以获得更好的频域分辨率;对于跳变信号,使用短块可以获得更好的时域分辨率。第3层在不降低音质的情况下提高了压缩比。虽然引入了许多复杂的概念,但是它的计算量并没有比第2层增加很多,主要增加了编码器的复杂度和解码器所需要的存储容量。3.5.3MPEG音频编码标准02MPEG-2Audio为多声道开发的低码率编码方案01和MPEG-1采用相同的编码器,三层编码的结构也形同02主要增加:1)更低的采样频率,增加了:16kHz、22.05kHz、24kHz2)扩展编码器输出速率范围:32~384kb/s→8~640kb/s3)增加信道数,支持5.1与7.1声道的环绕声033.5.3MPEG音频编码标准02MPEG-2Audio3.5.3MPEG音频编码标准02MPEG-2AudioMPEG-2的向下兼容;在MPEG-2标准中,将多声道中的中心声道C、左右环绕声道LS、RS和低音效果增强声音LFE等多声道扩展MC信息,视为MPEG-1左右声道的辅助数据进行传送。3.5.3MPEG音频编码标准03MPEG-2AAC是MPEG-2中的声音感知编码标准,利用人耳听觉系统的掩蔽特性来减少数据量;子带编码将量化噪声量化到各个子带中,利用全局信号将噪声掩蔽。01采样频率:8~96kHz02输入:单声道、立体声、多声道音源的声音03支持48声道、16LFE&16个配音声道&16个数据流04压缩比:11:1053.5.3MPEG音频编码标准03MPEG-2AACAAC增益控制:多相正交滤波器+增益检测器+增益修正器;将输入信号分离到4个相等带宽的频带中,可改变输入信号的采样频率滤波器组:将输入信号从时域变换到频域的转换模块,由一组带通滤波器组成,是MPEG-2AAC系统的基本模块。该模块采用了改进离散余弦变换(MDCT),这是一种线性正交重叠变换,具有时域混叠取消功能。瞬时噪声整形:用于控制每个变换窗口的量化噪声的瞬时形状,通过采用滤波方法实现,用来解决掩蔽阈值和量化噪声的匹配问题。联合立体声编码:这是空间编码技术,目的是为了去掉空间冗余信息,该技术比对每个声道的声音单独进行编码更有效。MPEG-2AAC系统包含两种空间编码技术:M/S编码和声强立体声编码,分别用于对不同频带的信号进行编码。预测:话音编码系统中普遍采用的技术,它主要用来减少平稳信号或周期信号在时间方向上的冗余。比例因子与量化器:AAC编码器采用非均匀量化技术,对较小的数值采用小的量化阶,产生的量化噪声较小;对较大的数值采用大的量化阶,产生的量化噪声较大。为了控制量化噪声的功率,在信号被量化之前要对不同频带使用不同的比例因子。3.5.3MPEG音频编码标准04MPEG-4audioMPEG-4是包罗万象的声音编码标准,是想覆盖整个声音频率范围的编码技术,从话音编码、声音编码到合成语音。该标准为每个声音规定的速率为2~64kb/s,并为此定义了三种类型的编码器:1)在数据速率为2~6kb/s范围内,可使用参数编码,声音信号的采样频率为8kHz。2)在数据速率为6~24kb/s范围内,可使用码激励线性预测编码技术(CELP),声音信号的采样频率为8kHz或16kHz。3)在数据速率为16~64kb/s范围内,可使用时间/频率编码(基于变换的普通声音编码)技术,如用MPEG-2AAC经过改进的MPEG-4AAC,支持8~96kHz的采样频率。3.5.4DolbyAC-3是由杜比实验室针对环绕声开发的音频压缩技术01技术:感知型压缩技术。eg.前/后向混合自适应比特分配、公共比特池、频谱包络编码、低码率条件下采用的多声道高频耦合等035.1声道条件下,码率为384kb/s,压缩比为10:102应用:院系统、高清晰度电视(HighDefinitionTelevision,HDTV)、消费类电子产品及直播卫星等方面04THANKS谢谢聆听
本文标题:多媒体通信.
链接地址:https://www.777doc.com/doc-2504031 .html