您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 基于声信号人耳听觉谱特征和SVME的水下目标识别-欢迎访
基于声信号人耳听觉谱特征和SVME的水下目标识别杨宏晖1彭圆2曾向阳1摘要利用人耳听觉谱特征模拟人耳听觉系统的特性,提取了水下目标信号的人耳听觉谱特征,设计了基于支持向量机自适应增强集成算法用于水下目标的分类识别算法。仿真实验证明,人耳听觉谱特征可有效用于水下目标识别,支持向量机自适应增强集成算法比单个优化的支持向量机分类器的正确识别率高5.96%~9.60%。关键词人耳听觉谱特征水下目标识别支持向量机集成1引言长期以来,为了提高水下目标识别的正确率,国内外研究人员从不同的角度对水下目标辐射噪声原始信号进行了分析和研究,提取了各种水下目标特征。提取的水下目标特征主要有以下几类:时域波形特征[1]、频域分析特征[2-3]、时频分析特征[4]、非线性特征[5]和听觉特征[6-7]。这些特征各有特点:时域波形特征的主要特点是方法简单、实时性好。但水下目标信号时域波形结构复杂,难以提取具有高分类信息的波形结构特征[1]。频域分析特征的特点是技术成熟、方法简单,而且谱信息中包含明确的物理概念,但适合处理线性、平稳信号[2-3]。时频分析方法提取的特征可以更好地反映目标的时域和频域特征。但小波分析算法较为复杂,存储量、运算量大,计算速度慢,实时性差。而且小波分析适合处理非平稳信号,处理非线性信号能力较弱[4]。我国学者的研究表明:舰船噪声有混沌现象,舰船噪声极限环有混沌行为,舰船辐射噪声的非线性表明同类目标具有相似性,不同类目标具有可分性[5]。但是在实际的随机噪声中,不存在严格的分形信号,大多数水声信号只是在某种尺度范围内具有分形特征。因此,分形与混沌方法仅是识别特征的补充。众所周知,依靠人耳极其灵敏的听觉系统和长期在实践中积累的经验来判断水下目标类型仍然是水下目标识别的重要途径之一。目前模拟人耳听觉系统进行水下目标识别的研究报道很少。国内外研究人员提取了水下目标辐射噪声信号的听觉特征、语音特征及心理声学参数特征[6-7]。利用这些特征可以识别目标的类型,甚至可以识别目标的材质。这类特征的主要特点是适于处理非线性的水声信号,而且原理简单,计算快速,具有较好的实时性。但这方面的研究工作还有待于进一步的深入。本文提出了根据人耳听觉模型提取水下目标信号的人耳听觉谱特征的方法;并提出了支持向量机自适应增强集成算法用于水下目标的分类识别。仿真实验结果表明,本文提出的水下目标信号听觉谱特征提取方法简单有效,运算速度快,人耳听觉谱特征可有效用于水下目标识别,支持向量机自适应增强集成算法比单个优化的支持向量机分类器的正确识别率高5.96%~9.60%。2人耳听觉感知模型人耳可以听到频率在20Hz~20KHz范围内的声音。人耳听觉系统是一个音频信号处理器,可以完成对声信号的传输、转换以及综合处理的功能,最终达到感知和识别目标的目的。人耳听觉系统有两个重要的特性[8],一个是耳蜗对于声信号的分频特性;另一个是人耳听觉掩蔽效应。2.1耳蜗的分频特性当声音经外耳传入中耳时,镫骨的运动引起耳蜗内流体压强的变化,从而引起行波沿基底膜的传播。不同频率的声音产生不同的行波,其峰值出现在基底膜的不同位置上。频率较低时,基底膜振动的幅度峰值出现在基底膜的顶部附近;相反,频率较高时,基底膜振动的幅度峰值出现在基底膜的基部附近(靠近镫骨)。如果信号是一个多频率信号,则产生的行波将沿着基底膜在不同的位置产生最大幅度。在每一声音频率上,随着强度的增加,基底膜运动的幅度增大,并且带动更宽的部分振动。从这个意义上讲,耳蜗就像一个频谱分析仪,基底膜可以看成是一组频带重叠的非线性带通滤波器,这组带通滤波器将整个频带划分为若干个不等宽频带,称为临界频带。耳蜗的分频能力,可以用一组带通滤波器来实现。2.2人耳听觉掩蔽效应人耳听觉掩蔽效应是一个较为复杂的心理和生理现象,人耳不仅在频域上有掩蔽效应,在时域上也有掩蔽效应。人耳对声音的感觉主要是由于声音引起基底膜不同部位的振动,所以一个较大声音引起一个位置产生较大振动的同时,会使其前后位置产生相应小的振动。如果另一个声音的频率对应于该位置且强度较弱,则该声音听不到,这就是声音的频域掩蔽。时域掩蔽效应是一个声音的人耳听觉感受被另一个声音(同时或不同时进入人耳)影响的现象。掩蔽效应是听觉系统的一个重要特性,它表明了人的听觉系统对频率和时间分辨力的有限性。为了描写这种掩蔽的效果,Zwicker等引入了临界带宽的概念。一个纯音可以被以它为中心频率,且具有一定频率带宽的连续噪声所掩蔽,如果在这一频带内噪声功率等于该纯音的功率,这时该纯音处于刚能被听到的临界状态,即称这一带宽为临界带宽。一个临界带宽可以用巴克(Bark)来表示。在20Hz-16KHz范围内的声音信号可以分为24个Bark。临界频带与频率是非线性关系。3听觉谱特征提取根据生理声学和心理声学以及语音信号处理的研究成果,我们提出一个基于人耳听觉感知模型的声音信号听觉谱特征提取算法用于水下目标识别,听觉谱特征具体提取过程如图1所示。临界频带段分析等响度级预处理等响度转换功率谱信号听觉谱特征图1听觉谱特征提取原理图这个人耳听觉感知模型也应用于语音信号处理的感知线性预测算法[9]。文献[7]研究了感知线性预测算法在水下目标识别中的应用。感知线性预测算法将经过图1所示步骤得到的听觉谱信号再进行IDFT变换得到信号短时自相关函数,接着用全极点模型来逼近信号短时自相关函数(线性预测分析),特征向量是全极点模型预测多项式的一组系数。本文提出的基于听觉模型的听觉谱特征提取算法利用人耳听觉感知模型直接计算声信号的听觉谱,用于描述水下目标,具有原理更加简单,计算量小,计算速度更快的特点,更易满足识别任务对时间的要求。具体实现过程如下:(1)对水下目标信号进行短时傅立叶变换,计算其功率谱()P;(2)临界频带分析首先将()P进行频域到Bark域的转2()6(/1200(/1200)1)In(1)其中,是以/rads为单位的角频率;是以Bark为单位的Bark域频率。然后将Bark域的功率谱()P与临界频带滤波器组曲线()Ψ相卷,临界频带滤波器组曲线如式(2)所示。2.5(0.5)1.0(0.5)01.3101.30.5()10.50.5100.52.502.5Ψ(2)功率谱()P与临界频带滤波器组曲线()Ψ离散卷积即可得到临界带听觉谱()k:2.51.3()()(),1,2,,24kkkΘPΨ(3)(3)等响度级预处理心理声学研究成果表明,在声强一定的情况下,人耳对不同频率声音敏感程度不同,人耳对中高频较为敏感,对3KHz到5KHz声音最敏感,所以要对临界频带分析所得到的谱进行等响度级变换。经过变换后的响度级谱为:()()()kkkΓE(4)k和k的关系可由式(1)得到,等响度级预处理曲线如式(5)所示。26426229626(56.810)/(6.310)()(0.3810)(9.5810)E(5)等响度级预处理以后的临界频带滤波器组频率响应如图2所示。(4)等响度转换经过以上处理后得到的谱为响度级谱。但响度级并不是响度,响度级与响度之间的关系是非线性的,为了模仿这一关系,也为了压缩谱的幅度,进行如式(6)所示的转换。13()()ΦΓ(6)经过这次处理后,可得到信号的24维听觉谱特征。4自适应增强SVME算法由于在水下目标识别问题中,样本获取难度大,样本往往是有限的,因此一些基于传统统计学的学习方法在对水下目标识别中的识别性能不尽人意。与传统统计学相比,统计学习理论可以很好的解决有限样本学习问题。支持向量机(SupportVectorMachine,SVM)就是在这一理论基础上发展的一种新的通用学习机,已经在人脸检测、手写数字识别、以及数据挖掘等领域成功应用。然而,支持向量机在实际应用中仍然有以下不足之处。首先,支持向量机的基本原理是解决两类识别问题的,多类识别问题是通过支持向量机组合方法来解决,然而分类性能没有提高。而且SVM在学习过程中因为时间和空间运算的高度复杂度,在运算过程中采取了近似计算。因此,有时候SVM对实测数据的分类结果与理论期望值有很大的差距。支持向量机集成(SupportVectorMachineEnsemble,SVME)可以显著提高SVM分类器的分类性能[10]。针对小样本、M类水下目标识别问题,本文设计了支持向量机分类器自适应增强集成算法,算法如下。输入:训练样本集:,,-1,1,1,2,,diiiiyyinXxx01(),1,2,iinnwK(训练样本的初始加权系数)输出:ffin(分类器集成)ForTt,,2,1按照概率()tip从X中抽取n个样本构成新的训练样本集tX,每个样本被抽中概率()tip的计算公式是:1()()()tnttiiiwpw根据tX确定个体SVM分类器核函数参数用tX训练SVM得到分类器f()ttX,计算f()ttX的加权分类错误率:1()ntiie,当f(())titiyX时,()()tiiew;当f(())titiyX时,()0ie。如果05t.或1t,结束循环;计算下一轮循环的样本加权权值:如果f(())ttiiyX,则1()()tttiiww,式中(1)ttt/;如果f(())ttiiyX,则1()()ttiiww;并进行归一化1111()()()tnttiiii(个体分类器集)1,2,,:f()1fargmaxlogfinjMtxjtK(输出分类器集成)算法在每次循环用不同的训练样本集训练一个个体分类器。训练个体分类器的训练样本集是用随机遍历抽样法,根据样本加权权值对原训练样本集进行重抽样构成,样本的加权权值越大,被抽中的可能性越大。由于在上一次循环中,赋予被错误分类的样本较大的加权权值,赋予被正确分类的样本较小的加权权值。因此,在每一次循环过程中,难分样本被抽取的可能性大。这使得在循环递进过程中,个体分类器的分类重点自适应地放在分类效果差的样本上,个体分类器分类性能逐渐增强。最后用加权多数投票法集成个体分类器。SVM分类器自适应增强集成算法训练个体分类器的训练样本集不同,个体分类器核函数参数不同,使得个体分类器之间具有很大的差异性,个体分类器的差异性增强了分类器集成算法的宽容能力。5实验及结果5.1实验数据集本文所用的水下目标信号的采样频率为22050Hz,每个样本的长度为4096点。水下目标分为A、B、C、D共4类,样本总数为1920,每类480个样本。由于受到实验数据采样频率(22050Hz)的限制,本文只在20Hz~9500Hz频率范围内,即前22个临界频带内提取了信号的听觉谱特征。5.2实验及结果在分类实验中,将1920个水下目标样本划分为9组训练样本集和测试样本集(测试集样本不包含训练样本)。将SVM分类器集成算法和单个SVM分类器分别对上述9组训练样本进行学习,然后统计两种算法对测试样本集合的分类正确率,结果如表1所示。为了避免样本选取的随机性对实验结果带来的误差,9组实验分别进行20次,最终结果为20次实验结果的平均值。表1分类实验结果样本训练样本数目测试样本数目平均正确分类率SVMESVM组119217280.85320.7852组238415360.89530.8055组357613440.91560.8196组476811520.91710.8242组59609600.92530.8453组611527680.95670.8970组713445760.95760.8997组815363840.96350.9021组917281920.96790.9083由表2可知,在9组实验情况下,SVM多类分类器集成算法比单个SVM多类分类器的正确识别率最少高5.96%(数据组9),最多高9.6%
本文标题:基于声信号人耳听觉谱特征和SVME的水下目标识别-欢迎访
链接地址:https://www.777doc.com/doc-637206 .html