您好,欢迎访问三七文档
标准样本距离分类器有R个类别:12,R每个类别各用一个标准样本表示:12,RMMM对待识别样本X进行分类采用最小距离分类原理,可得分类规则为:(X,M)d(X,M)ijdijiX1,2jR例如如果采用欧几里得距离2()()2j1(X,M)(xm)niijid(XM)(XM)1X2()2TjjTTTjjjXXMMM取1(X)2TTjjjjgXMMM因为与j无关,分类规则可写为:(X)g(X),jiijigXTXX分散样本的距离分类器各类具有分散样本,如有R个类别:12,R第m个类有样本集合:12,,,mmmKXXX然后对待识样本X进行分类。一平均样本法平均样本法是由各类的训练样本集,求平均值作为标准样本。例如假设有s个样本,取标准样本为:j1sXX11sjttMXs然后采用前述的最小距离分类器进行分类。这种方法最简单,但是完全没有考虑样本散布对分类的影响。二平均距离法平均距离法是用待识别样本与的所有训练样本的平均距离表示待识别样本与类的距离ii2211(X,)(X,X)sjttdds以最小的距离作为X的分类。考虑了样本散布的影响,故在样本散布较大时,效果优于平均样本法,但需要存储所有的训练样本,计算量大。三最近邻法最近邻法以与待分类样本X距离最小的训练样本类别作为X的分类:1,2(X,)min(X,X)jttsdd然后采用前述的最小距离分类器进行分类。这种简单分类原理可以分割大多数几何可分的类别。但它也要存储和计算所有训练样本;同时在分类时只利用最近邻样本的信息,而未能充分利用所有样本信息,因而圾易受噪声影响。最邻近法的改进:平均样本法:用一点代表一个类别,过于集中;最近邻法:以类内的每一点代表类别,过于分散;改进最近邻法:将每个类别的训练样本划分为几个子集,以子集的平均样本作为代表样本。然后用最邻近法分类。K-近邻法:根据待分类样本X最邻近的k个样本点中多数点的类别来分类。计算X与所有训练样本的离,找到最近邻的k个点,算得其中属于类的点数,并按以下判别规则分类。jjk,ijikkjiX其中1,,Rjjkk最小距离分类法特点:最小距离分类器宜用于低维、小样本数、样本散布小的情况。而且应从实际分类试验中的错误概率来判定分类方法的适用性。应用案例语音识别:用MFCC参数作为人语音特征,MFCC系数计算过程分可为三个步骤:计算音频信号的快速傅里叶变换;滤波器组滤波;离散余弦逆变换得到MFCC系数。计算公式如下:11(m1)/2(k)(m)cos()MmkCLM本例中舍去代表直流成分的C(0),取C(1),C(2),……C(K)作为MFCC参数。取K=12。然后采用平均样本法,根据测试和训练数据,对目标人的多个分析帧的训练特征矢量计算平均值,然后找出这些平均训练矢量和测试矢量之间的距离__1211(C(m)(m))1RtstrmDCR取一阀值T,DT,则认为是目标对象讲话。
本文标题:距离分类器
链接地址:https://www.777doc.com/doc-6702252 .html