您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 基于统计的特征提取技术方法的研究综述
基于统计的特征提取技术方法的研究综述【摘要】特征提取就是利用已有特征参数构造一个较低维数的特征空间,将原始特征中蕴含的有用信息映射到少数几个特征上,忽略多余的不相干信息。特征提取的方法有很多种,如传统的特征提取的数据挖掘技术、统计特征提取技术、神经网络法等。本文主要是介绍基于统计的特征提取技术方法的研究综述,以及介绍其在现代的健康检测系统中的应用。【关键词】主组分分析;核主组分分析;独立组分分析一、主组分分析主组分分析(PrincipalComponentAnalysis,PCA)法是一种仅根据输入数据的统计特征,而不需要目标数据的数据处理方法。被典型地应用于多维数据的统计分析之中,其目的在于简化统计数据和揭示变量间的关系。PCA是一种数据的预处理方法,常常与一些智能损伤诊断方法结合起来使用。通过对转子类常见故障的诊断分析,证明该方法具有比BP神经网络训练时间更短、诊断准确率稍高的特点。刘晓洁针对基于信息论的贝叶斯网络结构学习算法中结点集越大计算效率越低的缺点,采用PCA对样本数据降维,减少构造网络的结点数量,提高贝叶斯网络结构构造算法的效率。应用基于PCA方法构造贝叶斯网络其结点少、结构简单,较传统贝叶斯网络具有较高的学习效率和分类准确率。PCA的优点是操作简单,物理意义清楚;但是它的缺点也很明显,如不能处理变量间非线性关系;当主成分较多时,评价结果可能引起不一致;而且主组分个数的选取存在一些人为的因素,所以要进一步深入的研究。二、核主组分分析PCA是最为常用的特征提取方法,被广泛应用到各领域,然而从本质上讲PCA方法是一种线性映射方法,在处理非线性问题时,往往不能取得好的效果。为此,专家、学者提出了一系列的非线性主组分分析方法,如NLPCA、KPCA等。非线性主组分分析方法(NLPCA)是在主成分分析的基础上改进过来的,NLPCA是将原始数据非线性的映射到特征空间中。核函数主组分分析(KPCA)将输入空间通过非线性映射投影到特征空间,然后对特征空间中的映射数据作主元分析,求取数据在非线性主元上的投影。这一非线性映射是利用内积运算实现的,即只需在原空间中计算用作内积的核函数,而无需关注非线性映射的具体实现形式,因此称作核函数主组分分析。但是核函数的选取以及核函数中一些参数的设置是目前进行KPCA研究遇到的瓶颈,基于此,一些专家学者也做了大量的工作。王新峰,邱静等提出一种基于矩阵相似度的核函数参数选优方法,首先给出一种具有较好分类能力的核函数矩阵;然后,利用矩阵间的相似度量关系,在一定范围内寻找能近似此矩阵的核函数参数值。柳桂国,柳贺提出利用卷积算子和H1(R)核函数给出了一种设计Hn(R)核函数的新方法,该方法简便易行。近年来,一些专家学者将KPCA技术应用到神经网络、SVM、决策树等智能模式识别方法中,进行损伤数据的非线性特征提取。总之,KPCA是一种有效地特征提取方法,但是KPCA中核函数以及参数的选择还需进一步进行深入的研究。三、独立组分分析独立组分分析(IndependentComponentAnalysis,ICA)是近期发展起来的一个新的数据及信号分析方法,是主组分分析的拓展。ICA着眼于数据间的高阶统计特性,使得变换以后的各分量之间不仅互不相关,而且还尽可能地统计独立。因此,ICA能更加全面揭示数据间的本质结构。从统计分析的角度来看,独立组分分析和主组分分析一样,同属多元统计分析的线性方法。但ICA以随机变量的非高斯性和相互独立为分析目标,最终是为了从多通道观测数据中分离出相互独立的信源,因此比PCA更进了一步。根据线性ICA模型以及分离结果相互独立这一限定条件,ICA分离算法的第一步是建立度量分离结果独立程度的准则(目标函数),然后对目标函数进行优化,找出分离矩阵W。ICA提取了隐藏多维数据里面的独立信息,这种高阶信息结构往往可以反映出一种独特的统计特征,有利于表达数据的本质。并且ICA还可以有效地剔除噪声,在结构的损伤识别中,作为一种数据的预处理方法。但是ICA还存在一定的问题,如对目标函数进行优化,找出分离矩阵W,还有待进一步的研究。参考文献[1]孙卫祥,陈进.基于PCA与决策树的转子故障诊断[J].振动与冲击.2007,26(3):72~74[2]刘小洁.基于PCA的贝叶斯网络分类器研究[J].电子设计工程.2009,17(9):86~88[3]毕小龙,王洪跃.基于核主元分析的传感器故障检测[J].2007,27(4):555~559[4]王新峰,邱静.核主元分析中核函数参数选优方法研究[J].振动、测试与诊断.2007,27(1):62~64[5]柳桂国,柳贺.模式分析的核函数设计方法及应用[J].华东理工大学学报.2007,33(3):405~409[6]杨金成,张南.独立成分分析技术综述[J].舰船科学技术.2007,29(2):83~86[7]张文爱,刘俊豪.基于粒子群算法的盲源分离算法[J]..太原理工大学学报.2006,37(2):169~172
本文标题:基于统计的特征提取技术方法的研究综述
链接地址:https://www.777doc.com/doc-6458379 .html