您好,欢迎访问三七文档
第5章预测编码5.1DPCM基本原理理想情况下,对信源符号的预测:利用符号间的相关性,知道符号越多越容易猜出,logN≥H1(XL)≥H2(XL|XL-1)≥…≥HL(XL|XL-1)≥H∞利用一个数学模型精确表达信源实际情况,很难满足这两个条件,因此设计一个好的预测器,使误差最小。DPCM原理框图5.1DPCM基本原理发送端发送一个初始值x0,然后发送预测误差5.1DPCM基本原理接收端把接收到的预测误差与预测值相加,得到恢复信号5.1DPCM基本原理接收端重建信号与发送端原始信号的误差:xk-xk’=xk-(xk+ek)=(xk-xk)-ek=qk由此可见:在DPCM系统中的误差来源是发送端的量化器,而与接收端无关,若去掉量化器,则可以完全不失真的恢复输入信号由于预测器和量化器的设计以及数字信道传输误码的影响,在DPCM系统中会出现一些图像降质现象。(1)斜率过载引起图像中黑白边沿模糊,分辨率降低这主要是当扫描到图像中黑白边沿时,预测误差信号比量化器最大输出幅面电平还要大得多,从而引起很大的量化噪声。5.1DPCM基本原理(2)颗料噪声:这主要是最小的量化输出电平太大,而图像中灰度缓慢变化区域输出可能在两个最小的输出电平之间随机变化,从而使画面出现细斑,而人眼对灰度平坦区域的颗粒噪声又很敏感,从而使人主观感觉上图像降质严重。(3)假轮廓图案这主要是由于量化间隔太大,而图像灰度缓慢变化区域的预测误差信号太小,就会产生像地形图中等高线一样的假轮廓图案。(4)边沿忙乱这主要在电视图像DPCM编码中出现。因为不同帧在同一像素位置上量化噪声各不相同,黑白边沿在电视监示上将呈现闪烁跳动犬齿状边沿。5.2最佳线性预测DPCM系统中存在一个如何能使误差尽可能减少的问题。应用均方误差为极小值准则来获得DPCM,称其为最佳线性预测。预测编码分为:非线性预测线性预测为了分析方便,误差信号ek=xk-xk=xk-5.2.1MMSE线性预测一般采用均方误差准则MSE,或最小均方误差准则MMSE:定义xk的均方误差为:欲使其最小,需分别对各个求偏微分,即])[(22kkexxE0])(2[])[(22ikkkikkiexxxExxE5.2.1MMSE线性预测将代入,得展开,得定义自相关则NixxxEikkk,,2,1,0])[(NixxExxEikkikk,,2,1,][][NixxEikkRikk,,2,1,][),(NixxEjiRji,,2,1,][),(5.2.1MMSE线性预测将代入,得自相关函数满足R(k-j,k-i)=R(k-I,k-j),当广义平稳时,R(k-I,k-j)=R(j-i)=R(i-j)=R(|i-j|),则NiikjkRxxExxEikkRNjjNjikjkjNjikjkj,,2,1,),(][][),(111NijiRikkRNjj,,2,1,|)(|),(15.2.1MMSE线性预测用矩阵表示为左边矩阵式Tooplitz矩阵,其正定、可逆,因此只要R(0)、R(1)、……、R(N)已知,则可解出N个预测系数)()2()1()0()2()1()2()2()1()1()1()0(NRRRRNRNRNRRRNRRR5.2.1MMSE线性预测如果{Xk}是各态历经的,且N足够大,则求得ai后,即可得到最小均方误差其中,为预测值与实际值的差值信号的最小方差;R(0)为实际信号的方差NikiixxNkR11)()()0(12miniRRNiie2mine5.2.2预测阶数的选择此时ek与ek+j不相关,再加大N也不会使变小当N=2时,0)(0()()1()1()()]1)([(][21121jjjjjkjkkkjkkRjRjRjRjRxxxxEeeE)0()(RjRj2e122212210111111kkxxaaaa5.3语音信号的预测编码语音波形的特性当肺部中的受压空气沿着声道通过声门发出时就产生了话音。普通男人的声道从声门到嘴的平均长度约为17厘米,反映在声音信号中就相当于在1ms数量级内的数据具有相关性,这种相关称为短时相关。语音分为:清音和浊音。1.浊音是由声带振动产生,每一次振动使一股空气从肺部流进声道。激励声道的各股空气之间的间隔称为基音周期。其值在2~20ms之间,称为长期周期性。2.清音是由不稳定气流激励所产生的,这种气流是在声门处在打开状态下强制空气在声道里高速收缩产生的。5.3语音信号的预测编码5.3.1语音信号的冗余度一、时域冗余度当信源本身具有冗余度,才能对其进行压缩。语音信号中存在着多种冗余度:1.幅度非均匀分布语音中小幅度样本比大幅度样本出现的概率要高。通话必然会有间隙,出现大量的低电平样本。此外,实际语音信号的功率电平也趋向于出现在编码范围的较低电平端。2.样本之间的相关性对语音信号的波形分析表明,采样数据的最大相关性存在于邻近样本之间。当采样速率为8KHz时,相邻采样值之间的相关系数大于0.85,甚至在相距十个样本之间,相关系数还有0.3左右的数量级。5.3.1语音信号的冗余度3.周期之间的相关性电话语音信号的频率分布在300-3400Hz的频带内,但在特定瞬间,某一声音中只有少数频率分量起作用。只有少数几个基本频率时,就会像某些振荡波形一样,在周期与周期之间存在着一定的相关性。4.基音之间的相关性浊音的波形对应于基音周期的长期重复波形。因此,对语音浊音部分可以对一个基音周期波形进行编码,并以它作为其它基音的模板。5.3.1语音信号的冗余度5.静止系数话音间隙大约为通话时间的40%,静止系数为0.6,它们也是一个冗余。6.长时自相关函数对较长的时间间隔进行统计表明,8kHz取样语音的相邻样本间,平均系数高达0.9。正是由于语音信号具有以上特点,对语音的压缩编码才成为可能。在现今的通信系统当中,各种语音压缩编码得到了广泛的应用,并形成了一系列的语音编码标准。5.3.1语音信号的冗余度二、频域冗余度1.非均匀地长时功率谱密度功率谱呈现强烈的非平坦性。高频能量较低,对应时域上相邻样本间的相关性。2.语音特有的短时功率谱密度整个功率谱的细节以基音频率为基础,形成高次谐波结构。5.3.2人的听觉感知机理心理声学模型1.人耳对不同频段声音的敏感程度不同在心理上,主观感觉的声音强弱使用响度级描述。人耳的听觉范围用等响度曲线来描述当声音弱到人的耳朵刚刚可以听见时,称此时的声音强度为“听阈”。声音强到使人耳感到疼痛,这个阈值称为“痛阈”。5.3.2人的听觉感知机理2.人类听觉系统具有掩蔽效应一种频率的声音阻碍听觉系统感受另一种频率的声音的现象称为掩蔽效应。掩蔽可分成频域掩蔽和时域掩蔽。(1)频域掩蔽一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽5.3.2人的听觉感知机理(2)时域掩蔽除了同时发出的声音之间有掩蔽现象之外,在时间上相邻的声音之间也有掩蔽现象,并且称为时域掩蔽。产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间。5.3.3从增量调制到LPC声码器传统语音压缩技术分为:波形编码:重建的语音信号与原始信号波形相同。语声编码:重建的语音信号与输入语音一样,但波形可以不同。一、语音预测编码1.增量调制DMDM是对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成“0”和“1”这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为“正”,则用“1”表示;相反则用“0”表示,或者相反。由于DM编码只须用1位对话音信号进行编码,所以DM编码系统又称为“1位系统”。5.3.3从增量调制到LPC声码器输入信号的预测值用表示输入信号变化快的区域,易产生斜率过载,在输入信号变化慢的区域,易产生粒状噪声。为了避免斜率过载,要加大量化阶Δ,但会加大粒状噪声;相反,要减小粒状噪声,就要减小量化阶Δ,这又会使斜率过载更加严重。][]1[iyiy5.3.3从增量调制到LPC声码器2.自适应增量调制(ADM)使增量调制器的量化阶Δ能自适应,也就是根据输入信号斜率的变化自动调整量化阶Δ的大小,以使斜率过载和粒状噪声都减到最小5.3.3从增量调制到LPC声码器3.自适应脉冲编码调制(APCM)是根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。改变量化阶大小方法:前向自适应和后向自适应前向自适应:根据未量化的样本值的均方根值估算输入信号的电平,以此来确定量化阶的大小,并对其电平进行编码作为边信息传送到接收端。后向自适应:从量化器刚输出的过去样本中来提取量化阶信息。由于后向自适应能在发收两端自动生成量化阶,所以它不需要传送边信息。5.3.3从增量调制到LPC声码器4.自适应差分脉冲编码调制(ADPCM)综合了APCM的自适应特性和DPCM系统的差分特性。核心思想:①利用自适应的思想改变量化阶的大小,即使用小的量化阶去编码小的差值,使用大的量化阶去编码大的差值②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。5.3.3从增量调制到LPC声码器接收端的译码器使用与发送端相同的算法,利用传送来的信号来确定量化器和逆量化器中的量化阶大小,并且用它来预测下一个接收信号的预测值。5.3.3从增量调制到LPC声码器二、语声编码1.线性预测编码(LPC)LPC出发点在于跟踪波形的产生过程,而不是传输波形本身。它传递的是反映这一变化过程的参量。在接收端,收到的这些语音参量通过一个时变数字滤波器,它根据发声原理合成原来的语音。称实现参量编码的编码器为语音编码器或声码器。LPC声码器就是在研究发音系统特点的基础上,设法提取语音信号的要素。这样就可以只传送这些要素而不再传送语音信号的波形。在接收端利用这些要素重建语音信号,称为合成语音。只要这些要素选择得恰当,所需码率就可很小而仍能保持良好的语音质量。5.3.4语音LPC实现在发送端,LPC通过分析话音波形来产生声道激励和转移函数的参数,对声音波形的编码实际就转化为对这些参数的编码,这就使声音的数据量大大减少。在接收端,使用LPC分析得到的参数,通过话音合成器重构话音。合成器实际上是一个离散的随时间变化的时变线性滤波器,它代表人的话音生成系统模型。时变线性滤波器既当作预测器使用,又当作合成器使用。分析话音波形时,主要是当作预测器使用,合成话音时当作话音生成模型使用。5.3.4语音LPC实现线性预测器是使用过去的P个样本值来预测现时刻的采样值。预测值:=线性预测误差为:=这是一个线性差分方程。12()[(1)(2)()]prepxnaxnaxnaxnp1()piiaxni)()()(nxnxneprepiiinxa0)(LPC声码器模型周期性信号随机性信号线性时变滤波器合成语言信号输出c(n)ABu(n)G增益控制5.3.4语音LPC实现u(n):波形产生的激励参量,c(n):输出的语音。A路是发浊音时的情况,用周期性信号来代表;B路是发清音时的情况,用近似于白噪声的随机信号来代表。线性时变滤波器的系数通过线性预测技术获得。一般有12个系数{ai}(i=1,2,…,12)。5.3.4语音LPC实现三个重要参量:基音周期P、清浊音判决u/v和代表语音强弱的增益参量G。语音信号由这15个参量决定。通过对每帧语音进行分析求出这15个参量,然后将它们量化、编码传送给收端。接收端用收到的参量和发声模型,综合、复制出语音信号
本文标题:第5章预测编码
链接地址:https://www.777doc.com/doc-3481762 .html