您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 基于DSP技术的MP3播放器
论文题目:基于DSP技术的MP3播放器专业:学号:姓名:老师:成绩:基于DSP技术的MP3播放器摘要:随着数字编解码及压缩技术的发展,语音文件也朝着高压缩比、高保真的方向发展,从MP1、MP2到目前的MP3格式。本文设计了一种廉价基于DSP的MP3播放器,利用硬件存储语音文件,并能够从PC机下载,从而可以随时更新MP3音乐。该MP3播放器同时附加了文本阅读的功能,可做到语音和文本的同步输出。关键词:MP3播放器DSP编码前言现在市场上推出了各种型号的MP3随身听,它们采用先进的智能控制技术,利用先进的芯片,不仅实现了MP3格式语音的播放,而且集多种功能于一身。但这些精巧的随身听价格较昂贵,因此本文根据要求设计了一种廉价MP3播放器,利用硬件存储语音文件,并能够从PC机下载,从而可随时更新MP3音乐。该MP3播放器同时附加了文本阅读的功能,可做到语音和文本的同步输出。MP3播放器的工作原理MP3全称是MPEGAudioLayer3,是MPEG-1/2(音频压缩)音频layerIII的简称,MPEG压缩格式是由运动图像专家组(MotionPictureExpertsGroup)制定的关于影像和声音的一组标准,其中MP3就是为了压缩声音信号而设计的是一种新的音频信号压缩格式标准。它结合了MUSICAM(掩蔽型通用子带综合编码和复用)算法和ASPEC(自适应谱分析听觉熵编码)算法两者的优势,算法最为复杂,但它的压缩比最大。在采用64kpbs/声道的码率时(大约12倍压缩比),仍能保证高品质的音响效果。现在非常流行MP3随身听,通过与PC的数据接口,可从PC上下载MP3源文件,并具有随时更新歌曲的能力。CD唱片采样率频率为44.1MHz,16Bits,数据量为1.4Mbps,而相应的MP3数据量仅为112kbps或128kbps,是原始数据量的1/12。也就是说传统的一张CD现在可以存放10倍甚至更多容量的音乐,但是在人耳听起来,感受到的音乐效果却没有什么不同。MP3随身听的工作原理,其实很简单,就是利用控制芯片(CPU),控制解码芯片和LCD液晶屏,由解码芯片把内置闪存或是外插闪存卡之中的MP3文件或WMA格式文件解码,然后经数模转换,最后从耳机输出。MP3播放器利用数字信号处理器DSP(DigitalSignProcesser)来完成处理传输和解码MP3文件的任务的。DSP掌管随身听的数据传输,设备接口控制,文件解码回放等活动。DSP能够在非常短的时间里完成多种处理任务,而且此过程所消耗的能量极少。首先将MP3歌曲文件从内存中取出并读取存储器上的信号→到解码芯片对信号进行解码→通过数模转换器将解出来的数字信号转换成模拟信号→再把转换后的模拟音频放大→低通滤波后到耳机输出口,输出后就是我们所听到的音乐了。MP3播放器系统构成结构由图1所示DSP处理速度快,功耗低,性能好,基于TMS320C5416DSP芯片的语音存储容量大,具有很好的通信音质等特点,因此被广泛应用于很多领域中。DSP实现的语音分析系统具有如下优点:音频数据占用资源少;音质通信级;开发难度低;语音芯片与DSP接口电路简单;体积小。C5416DSP芯片的总线结构DSP芯片的基本特点是采用了哈佛总线结构,C5416DSP芯片的结构是以8组16位总线为核心,形成了支持高速指令执行的硬件基础。8组总线分为1组程序总线,3组数据总线和4组地址总线。C5416DSP芯片的中央处理器中央处理器CPU是DSP器件的核心部件,它的性能直接关系到DSP器件的性能。为了满足处理速度的要求,TMS320C5416DSP芯片的CPU采用了流水线指令执行结构和相应的并行结构设计,使其能在一个指令周期内,高速地完成多项算术运算。CPU的基本组成如下:40位算术逻辑运算单元(ALU);2个40位累加器(ACCA,ACCB);1个支持16—30位移位的桶形移位寄存器;乘法器—加法器单元(MAC);比较选择和存储单元(CSSU);指数编码器;CPU状态和控制寄存器。C5416DSP芯片的存储空间结构TMS320C5416DSP芯片共有192千字的可寻址存储空间。这192千字的存储空间分为3个独立的可选择空间,分别为:64千字的程序存储空间;64千字的数据存储空间;64千字的I/O空间。所有的TMS320C5416DSP芯片都包括内部随机存储器(RAM)和只读存储器(ROM)。内部随机存储器RAM又分为单寻址RAM(SARAM)和双寻址RAM(DARAM)两种类型。通常,SARAM和DARAM被映射到数据存储空间用来存储数据,也可以映射到程序空间用来存储程序代码。TMS320C5416DSP芯片的并行结构和内部随机存储器RAM的双寻址能力,可使CPU在任何一个给定的机器周期内同时执行4次存储器操作,包括1次取指,2次读操作数和1次写操作数。C5416DSP芯片的片内外设电路为了满足数据处理的需要,TMS320C5416DSP芯片提供了必要的片内外部设备。这些外部设备主要包括:通用I/O引脚;定时器;时钟发生器;主机接口HPI;串行通信接口;软件可编程等待状态发生器;可编程分区转换逻辑。C5416DSP芯片的系统控制TMS320C5416DSP芯片的系统控制是由程序计数器(PC),硬件堆栈,PC相关的硬件,外部复位信号,中断,状态寄存器和循环计数器(RC)等组成的。TMS320C5416DSP芯片的外部总线TMS320C5416DSP芯片的外部总线具有很强的系统接口能力,可与外部存储器以及I/O设备相连,能对64K字的数据存储空间,64K字的程序存储空间,以及64K字的I/O空间进行寻址。独立的空间选择信号DS,PS和IS允许进行物理上分开的空间选择。接口的外部数据准备输入信号(READY)与片内软件可编程等待状态发生器一道,可以使处理器与各种不同速度的存储器和I/O设备连接。接口的保护方式能使外设对TMS320C5416DSP芯片的外部总线进行控制,使外部设备可以访问程序,数据和I/O空间的资源。C5416DSP芯片是一种特殊结构的微处理器,为了快速实现数字信号处理运算,采用了流水线指令结构和相应的并行处理结构,可在一个周期内对数据进行高速的算术运算和逻辑运算。C5416采用先进的哈佛结构,具有片内存储器、中断、串口、并口等丰富的资源,加上高度专业化的指令系统,使C5416具有很高的性价比,已经广泛应用于通信、语音处理、图像处理、仪器仪表等无线电通信系统中。DSP、MPU硬件设计DSP扩展了一片64K字高速静态RAM(CY7C1021V33-10),作为DSP芯片的片外RAM,用以适应各种音频处理算法对存储器容量的要求。DSP芯片处理后的信号由D/A输出到耳机,我们就可听到MP3音乐。D/A变换由LM4545实现,它具有48K字转换速度,可直接和DSP芯片的输出相连。而MPU主要完成三项功能,分别是LCD显示,控制DSP芯片的运行和文件的串口下载。MP3是目前世界上最流行的音频格式之一,其采用了MPEG-1Ⅲ层标准压缩编码格式。遵循MP3标准的音乐具有很高的压缩率和较高的保真度,其压缩比可达1:10~12,即1分钟CD音质的音乐经过MP3压缩编码后,可以压缩到1兆左右而基本保持不失真。MP3的压缩率很高,失真也较小,但它的算法也较为复杂。MP3文件的内容是音频位流数据文件,它由若干个数据帧组成,每帧中的音频数据含有1152个原始音频信号的采样信息,并且经过霍夫曼编码形成。数据帧的其它内容分别为:头标信息:音频位流的一部分,它包含同步和状态信息。校验字:音频位流的一部分,它包辅助信息:音频位流的一部分,它包含每帧中可用于解码的相关信息。缩放因子信息:音频位流的一部分,它包含用于计算音频数据量化比例因子的信息。霍夫曼编码数据:音频位流的一部分,它包含每帧中所有原始音频采样数据的霍夫曼编码。附加数据:音频位流的一部分,它可包含一系列用户定义的辅助数据。图2解码流程LayerⅢ采用了较复杂的比特流结构。解码程序的流程图如图3所示。首先获得每一帧的同步字,取得头信息,从而获得各相应参数,根据对头信息的解析进而得到实际的一帧音频数据。读取主数据获得比例因子数据,对样本进行解码,然后对解码样本顺序进行倒置,如果块类型(BlockSplit_type)和标志类型(Flag_typ)都为1时,对样本进行重新排序,根据边信息中霍夫曼码本的选择信息进行霍夫曼解码,然后进行反量化,根据帧头的立体声信息,对反量化结果进行立体声处理。最后通过混迭处理、IMDCT和合成滤波器重建数字音频信号图3头信息的读取及相应处理由于MP3为了获取更高的数据压缩比,采用了较为复杂的比特流结构。当然处理帧的主数据(包含缩放因子和霍夫曼码字)起始位置一般不在该帧边信息后,而是根据边信息中参数值决定主数据起始位置的前移字节数。由于该值为9bit,其最大值可达511,典型的LayerIII码流如图4所示:图4由于帧内比特数=帧的大小×位率/采样率,而对于LayerIII每帧有1152个采样,采样率有44.1KHz,48KHz,32KHz三种,码率可从32kps到320kbps不等。故而一帧内最大字节数达到1152×320k/(32k*8)=1440B。读取比例因子、霍夫曼码字并进行霍夫曼解码根据最大的量化值和信号的局部统计特性选用不同的霍夫曼码表。(总共32个可能的表)由于对领域量化值进行编码,故把从零到奈奎斯特频率整个频率范围上的量化值分为大值区、小值区和零值区三个部分,对于大值区和小值区采用不同的编码策略,大值区每两个量化值转换为一个霍夫曼码字,而小值区每四个量化值转换为一个霍夫曼码字。非均匀反量化对于不同的块类型采用不同的反量化方式。每帧有两个粒度组组成,根据帧首边信息,粒度组有纯长度组、纯短块组、混合组三种类型。对于长块和短块作用了不同的反量化方式。由于在反量化过程中涉及到求一个整数的3/4次方的操作,结合霍夫曼解码的结果,发现大量的霍夫曼解码绝对值都处于0到255之间,所以把整个0到8191的区间分成四个不同的小区间,每个区间采用不同的定点数据格式,从而有效地提高了各个段内的比特利用率。混迭信号的消除对于长块和特殊的短块,合成滤波器组的输入在做IMDCT(反离散余弦变换)处理之前要进行混叠信号的消除。LayerIII的混迭信号消除采用与FFT类似的蝶形结构,若充分利用DSP为计算FFT而专门设计的指令,可以大大减少运算量。IMDCT(反离散余弦变换)经过混迭消除后的信号便要进行IMDCT变换。长块进行18点到36点的IMDCT变换,短块进行三个6点到12点的IMDCT变换,再将这三个长为12的输出矢量进行叠加,生成一个长为36的最终变换结果。子带合成滤波器子带合成滤波器将32个等频带宽内的频域信号反变换成时域信号,是由初始化、IMDCT、采样值加窗和32个样值叠加输出等部分组成。子带合成滤波器接收到的是经过霍夫曼解码、反量化、混迭消除及IMDCT变换的一个通道中的32个子带的样值,经过IMDCT变换后,32个样值会生成64个中间值。将这64个中间值输入到一个长为1024的先进先出缓存,再构成一个512的矢量,进行加窗运算。窗的系数是由ISO/IECMPEG标准中的合成窗系数表格提供的。最后将加窗结果进行叠加生成32个时域输出结语该MP3播放器基于DSP技术,采用慢速大容量外存加高速小容量外存的组合方式,音乐文件先从慢速外存下载至高速外存再载入DSP的高速RAM,下载一部分处理一部分。采用与PC机的串口通信方式实现文件的下载速度较慢,也可利用USB接口进行高速的通信。另外系统中连接的电话线可充作电话的录音。实践证明,这种方法设计的MP3播放器成本较低,同时附加文本阅读的功能做到语音和文本的同步输出,能满足特殊的需要。参考文献:[1]廖日坤李宁宇黄小惠基于DSP技术的MP3播放器的研究与设计南开大学信息学院[2]曹阳王培容黎明DSP原理及实践应用机械工业出版社2015.1教师评语:
本文标题:基于DSP技术的MP3播放器
链接地址:https://www.777doc.com/doc-2533705 .html