您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 数字电视C4v2008
上海交通大学数字电视原理与应用PrincipleandApplicationofDigitalTelevision主讲:张文军教授上海交通大学图像通信与信息处理研究所Email:zhangwenjun@sjtu.edu.cnMPEG-2音频编码及其测量,class042数字电视原理与应用课程安排1数字电视概述•电视技术的发展历程•模拟电视原理•数字电视的发展2数字电视基本原理视频压缩原理MPEG-2视频编码及测量MPEG-2音频编码及测量MPEG-2系统及其测量数字调制基础数字电视的纠错编码原理3数字电视相关标准•DVB-S标准及相关测量•DVB-C标准及相关测量•OFDM技术•DVB-T标准及相关测量•ATSC和ISDB-T标准及其测量•我国的数字电视标准MPEG-2音频编码及其测量,class043数字电视原理与应用数字电视基本原理视频压缩原理——第5章MPEG-2视频编码部分及其测量——第4,6,11章MPEG-2音频编码及其测量—第7章MPEG-2系统部分及其测量——第3,9,10章数字调制基础——第12章数字电视中的纠错编码原理——补充MPEG-2音频编码及其测量,class044数字电视原理与应用MPEG-2音频编码及其测量1.数字音频源信号2.音频编码历史3.人耳心理声学模型4.音频编码的基本原理5.子带编码6.变换编码MPEG-2音频编码及其测量,class045数字电视原理与应用人耳动态范围大约140dB,听觉带宽最大20kHz。在模拟音频信号采样数字化之前,要经过低通滤波器进行带限。1、数字音频源信号图7.1数字音频源信号15~20kHzBW15~20kHzBWRightLeftMPEG-2音频编码及其测量,class046数字电视原理与应用然后进行模数转换:采样分辨率:至少16bits采样频率:•32kHz——MPEG标准仍支持,但已经不用•44.1kHz——音频CD•48kHz/96kHz——演播室质量1、数字音频源信号图7.1数字音频源信号15~20kHzBW15~20kHzBWRightLeft32/44.1/48kHz音频采样频率32/44.1/48kHz音频采样频率ADAD16bit16bitMPEG-2音频编码及其测量,class047数字电视原理与应用16bit48kHz采样的码率每个信道786kbit/s立体声信号近似码率为1.5Mbit/s音频压缩目标:——将1.5Mbit/s码率降低到100~400kbit/s1、数字音频源信号图7.1数字音频源信号15~20kHzBW15~20kHzBWRightLeft1.5Mbit/sCompression100~400kbit/sAD32/44.1/48kHz音频采样频率AD32/44.1/48kHz音频采样频率16bit16bitUpto768kbit/sUpto768kbit/sMPEG-2音频编码及其测量,class048数字电视原理与应用MP3音频文件通常码率为32kbit/s与视频压缩相似,音频压缩也有两种方式:冗余度消除——省略多余信息,无损不相关性消除——省去接收端(人耳)不能察觉的信息,有损所有音频压缩方法基于心理声学模型,利用人耳的不足,消除音频信号中的不相关信息。人耳不能察觉频域和时域中强声音脉冲邻近的声音对人耳而言,某些声音可以掩盖其他低幅度的声音信号。1、数字音频源信号MPEG-2音频编码及其测量,class049数字电视原理与应用MPEG-2音频编码及其测量1.数字音频源信号2.音频编码历史3.人耳心理声学模型4.音频编码的基本原理5.子带编码6.变换编码MPEG-2音频编码及其测量,class0410数字电视原理与应用子带编码2、音频编码历史MASCAMIRTMunich,1988MUSICAMIRT,CCETT,Philips,Matsushita,1989MASCAM1988,InstitutfürRundfunktechnik(IRT)为DAB(digitalaudiobroadcasting)系统提出MUSICAM(maskingpatternuniversalsubbandintegratedcodingandmultiplexing)1989,CCETT,Philips和Matsushita联合提出用于DAB上两种都基于子带编码,音频信号分成大量子带,每个子带进行或大或小程度的不相关性消除。MPEG-2音频编码及其测量,class0411数字电视原理与应用子带编码2、音频编码历史MASCAMIRTMunich,1988MUSICAMIRT,CCETT,Philips,Matsushita,1989DCT变换编码ASPECFraunhoferGesellschaft,ThomsonMASCAM1988,InstitutfürRundfunktechnik(IRT)为DAB(digitalaudiobroadcasting)系统提出MUSICAM(maskingpatternuniversalsubbandintegratedcodingandmultiplexing)1989,CCETT,Philips和Matsushita联合提出用于DAB上两种都基于子带编码,音频信号分成大量子带,每个子带进行或大或小程度的不相关性消除。ASPEC方法FraunhoferGesellschaft和Thomson提出基于变换编码利用DCT将时域音频信号变换到频域,然后消除不相关性信号分量。MPEG-2音频编码及其测量,class0412数字电视原理与应用子带编码2、音频编码历史MASCAMIRTMunich,1988MUSICAMIRT,CCETT,Philips,Matsushita,1989DCT变换编码ASPECFraunhoferGesellschaft,Thomson声道LayerI,低复杂度,低压缩比LayerII,中复杂度LayerIII,高复杂度,高压缩,子带和变换编码,mp3ISO/IEC11172-3MPEG1音频,1990/91子带编码的MUSICAM和变换编码的ASPEC都包含在MPEG-1音频压缩标准中,分3层:LayerI和II——MUSICAM编码LayerIII(MP3音频文件)——ASPEC编码MP3不是MPEG-3,MPEG-3起初为实现HDTV,但HDTV后来集成到MPEG-2,所以MPEG-3不存在。MPEG-2音频编码及其测量,class0413数字电视原理与应用子带编码2、音频编码历史MASCAMIRTMunich,1988MUSICAMIRT,CCETT,Philips,Matsushita,1989DCT变换编码ASPECFraunhoferGesellschaft,Thomson声道LayerI,低复杂度,低压缩比LayerII,中复杂度LayerIII,高复杂度,高压缩,子带和变换编码,mp3ISO/IEC11172-3MPEG1音频,1990/91ISO/IEC13818-3MPEG2音频,1994LayerI,II,III与MPEG-1相同LayerII,MC(5.1声道)MPEG-2音频在MPEG-1基础上又增加了layerIIMC(multichannel)MPEG-2音频编码及其测量,class0414数字电视原理与应用美国Dolby实验室提出的Dolby数字音频标准(AC-3)1990年提出,1991年12月,第一部AC-3音频编码电影“StarTrackVI”公映许多电影采用Dolby数字技术。美国数字地面广播ATSC只采用AC-3音频编码。其他一些国家(如澳大利亚)将同时采用MPEG和AC-3音频。MPEG和AC-3音频的质量基本没有差别,现代MPEG解码芯片支持两种方法。DVD同时支持PCM音频、MPEG音频和AC-3音频编码。2、音频编码历史MPEG-2音频编码及其测量,class0415数字电视原理与应用AC-3的应用电影ATSCMPEG-2TS流DVDAC-3基于MDCT(modifiedDCT),5.1声道,每声道128kbit/sMPEG支持新音频编码方法:MPEG-2AAC(advancedaudiocoding)ISO/IEC13818-7MPEG-4ISO/IEC14496-3(自然/合成音频对象)MPEG-7ISO/IEC159382、音频编码历史MPEG-2音频编码及其测量,class0416数字电视原理与应用MPEG-2音频编码及其测量1.数字音频源信号2.音频编码历史3.人耳心理声学模型4.音频编码的基本原理5.子带编码6.变换编码MPEG-2音频编码及其测量,class0417数字电视原理与应用冗余度降低(无损)和不相关性降低(有损)可以将原始声音信号码率降低90%。不相关性降低依赖于人耳的心理声学模型——Zwicker教授知觉编码——人耳不能分辨的声音分量不传输。人耳剖面图,分为三个主要部分:外耳、中耳、内耳。3、人耳心理声学模型MPEG-2音频编码及其测量,class0418数字电视原理与应用3、人耳心理声学模型外耳实现阻抗匹配功能,声音通过空气传输,类似3kHz区域回声递升滤波器。人耳灵敏度最高的范围正是:3kHz~4kHz。耳膜或鼓膜将声波转换为机械振动,通过锤骨、砧骨、镫骨传送到通向感觉内耳的膜状窗。耳膜前后的空气压力必须相同,这由耳膜后面的咽鼓管来保证,咽鼓管使得该区域与咽部相连通。当我们到很高的高度时,耳内会有很大压力,通过吞咽动作,咽鼓管内的黏膜可以补偿压力。图7.4人耳的技术模型外耳鼓膜锤骨中耳耳咽管听觉神经高频接收器隔膜内耳低频接收器图7.3人耳剖面图MPEG-2音频编码及其测量,class0419数字电视原理与应用内耳有平衡器官,由几个充满液体的弓形和耳蜗构成。耳蜗是真正的听觉器官,直接听到声音。如果展开耳蜗会在其入口处发现高频传感器,然后是中频传感器,最末端是低频传感器。耳蜗由一个螺旋型管道组成,内部有一个更小的膜状螺旋型通道,从前到后越来越宽。内耳膜上分布着频率选择、声音采集传感器,将听觉神经连接到大脑。3、人耳心理声学模型图7.4人耳的技术模型外耳鼓膜锤骨中耳耳咽管听觉神经高频接收器隔膜内耳低频接收器图7.3人耳剖面图MPEG-2音频编码及其测量,class0420数字电视原理与应用3、人耳心理声学模型听觉神经传送的电信号幅度近似为100mVpp,电脉冲的重复率为1kHz数量级,这个速率包含的信息是某个频率音调的音量。音调的音量越高,重复率越大。每个频率传感器通过一个独立的神经线与大脑通讯。传感器的频率选择性在低频处最大,随频率升高而降低。图7.5人耳的机械/电子模型MPEG-2音频编码及其测量,class0421数字电视原理与应用与音频编码相关的人耳特性人耳的灵敏度在很大程度上依赖于频率。低于20Hz,高于20kHz的声音信号人耳无法听到。人耳最敏感范围为3kHz~4kHz,在该范围之外,人耳敏感度向高频和低频两个方向降低。低于某个阈值的声音人耳无法听到,该阈值取决于频率,声音信号中低于该阈值的分量无需传送,对人耳而言是不相关信息。MPEG-2音频编码及其测量,class0422数字电视原理与应用与音频编码相关的人耳特性掩蔽现象:例如一个测试人员听一个幅度固定的1kHz正弦波,同时添加其他不同频率和幅度的正弦波,发现在1kHz附近低于某个阈值的其他正弦信号听不到,该阈值取决于频率,称作掩蔽阈值。掩蔽阈值曲线取决于掩蔽信号的频率,掩蔽信号的频率越高,被掩蔽的范围越大。这一特性叫做频域掩蔽。在掩蔽阈值以下的声音分量不需传送。图7.7频域掩蔽图7.8掩蔽阈值MPEG-2音频编码及其测量,class0423数字电视原理与应用与音频编码相关的人耳特性时域掩蔽时域中一个强脉冲会掩蔽该脉冲前后低于某个阈值的声音信号。
本文标题:数字电视C4v2008
链接地址:https://www.777doc.com/doc-1479042 .html