您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 图像特征提取方法概述
课程设计报告设计题目:图像特征提取方法概述__学院:电子工程学院专业:电子信息工程班级:学号:姓名:__电子邮件:日期:2012年9月_成绩:指导教师:西安电子科技大学…………………………装………………………………订………………………………线………………………………………………………………电子工程学院课程设计(报告)任务书学生姓名王宇指导教师白静职称副教授学生学号02099013专业电子信息工程题目图像特征提取方法概述任务与要求查找阅读文献学习图像特征的提取方法,了解图像特征、提取方法的概念和分类,以及对具体提取方法的介绍和比较,并对相关内容做总结和分析,在此基础上撰写一份不少于3000字的科技文献综述报告。开始日期2012年8月27日完成日期2012年9月7日课程设计所在单位电子工程学院2012年9月图像特征提取方法概述摘要随着科技发展和图像信息的大量产生和交流,目标图像的自动识别和分类应用越来越广泛,同时实际应用问题对目标识别技术的要求也越来越高,特征提取的方法显得尤为重要。本文通过对图像特征原理的介绍,对几种典型的图像特征方法进行了分析和比较,并对其前景进行了展望。1、引言随着信息化社会的到来,人们获取的信息已经不是局限在数字、符号、文本等信息,而是越来越多的处理图像信息。然而这些信息大多数或是具有很高的维数,或是获得的图像数量巨大。在大多数情况下,不能直接在这些测量空间中进行分类和识别。这一方面是因为测量空间的维数很高,不适宜分类器和识别方法的设计:更重要的是这样一种描述并不能直接反映测量对象的本质,并且它随摄像机位置、照度、运动等因素的变化而变化。为了进行分类器和识别方法的设计,需要把图像从测量空间变换到维数大大减少的特征空间,被研究的图像在这个特征空间中就由一个或几个特征向量来表示。综上所述,特征提取技术成为目标分类和识别中的关键技术。2、图像特征提取的原理及分类(1)图像特征提取的原理在目标分类和识别过程中原始特征的数量可能很大,或者说样本处于一个高维空间中,这会给分类器带来沉重的计算负担。因此,我们希望选择或提取的特征应具有以下特点:简约性:在用很少的特征标识目标的条件下,保持信息(或信息去失可以控制);可分性:来自同一类的不同模式的特征非常接近,而不同类的模式的特征相距甚远。可靠性:提取具有鲁棒性(robust)的特征,即对噪声或其它干扰不敏感。获取特征的方法有两种:特征选择和特征提取。它们的根本任务就是如何从许多特征中找出最有效的特征,这里的有效指的是能够区分不同的类别。从一组特征中挑选出一些最有效的特征,以达到降低特征空间维数的目的,这个过程叫做特征选择。通过映射(或变换)的方法可以用低维空间来表示图像,映射后的特征称为二次特征,它们是原始特征的某种变换(通常是线性变换或是非线性变换),得出数目比原来少的综合性特征,对原始特征进行变换得到的这些有利于分类、更本质、更少的新特征的过程称为特征提取。(2)图像特征提取的分类一般来说,图像特征的分类有很多种,如按提取的区域大小可以分为图像的局部特征以及全局特征;按特征在图像上的表现形式分为点特征、线特征和面特征(区域特征);将用于目标图像识别的特征归纳为如下四种:图像的视觉特征:例如,图像的边缘、轮廓、形状、纹理和区域等。它们的物理意义明确,提取比较容易。图像的统计特征:例如,灰度直方图特征、矩特征,其中矩特征包括均值、方差、峰度及墒特征等,目前,墒特征作为图像的特征得到了广泛的应用。变换系数特征:对图像进行各种数学变换,如傅立叶变换、离散余弦变换、小波变换等,可以将变换后的系数作为图像的一种特征。代数特征:代数特征反映的是图像的某种属性。而从映射角度考虑,将能够通过线性映射得到的特征称为线形特征,经过非线性映射得到的特征称为非线性特征。对应的映射称为线性特征提取方法和非线性特征提取方法。3.图像特征提取的方法及比较(1)线性特征提取方法传统的线性特征提取方法有主分量分析(PrincipleComponentAnalysis,PCA)、Fisher线性鉴别(FLD),投影寻踪(ProjectionPursuit,PP)等。下面将重点对PCA算法及Fisher算法进行介绍:1主成分分析方法(PCA)主成分分析的目的是将分散在一组变量上的信息集中到某几个综合变量(又称为成分)上,这些新变量是原始变量的线性组合而且互不相关。由于对变量的综合,将可能克服多重相关性造成的信息重叠。几何上主成分分析可以认为是坐标轴的旋转,将原始坐标系的坐标轴旋转成一组新的正交坐标轴,并按他们占原始数据变差的数量排列这些新的坐标轴。主成分分析的对象是一幅图像矩阵qpX*)(,它的工作目标是对X总的信息重新调整组合,从中提取m个综合变量v1,...,vm(mq),使这m个综合变量能最多的概括原始图像X中的信息,即在力保数据信息损失最少大的原则下,对高维变量空间进行降维处理。设X=[1X,...qX],经过标准化,标准化的目的是使样本点集合重心与坐标原点重合。现求v1,...vm(mq),,它们是1X,...,qX线性组合,即1v=X1a,|1a|=1,因为1v带有最多变异信息,所以要求1v,方差取最大值,即111)var(VaavT(1)记V是X的协方差矩阵,即求优化111||a1maxVaaT(2)1a称为第一主轴,1v=X1a称为第一主成分。第一主成分带有的变异信息1111)var(VaavT(3)类似以上步骤依次有).(,...,2,1,qmmkXavkk.这m个主成分带有的信息总和为kmkkmkv11)var((4)成分个数m的选择:通用的方法是方差的百分比方法,即保留占方差近90%的特征值。另一种方法是保留那些特征值大于平均值的特征值。主分量分析反映了目标类别主要特征信息,在最小均方误差意义下是一种最佳变换。但它却没有利用类别属性及类别差异信息,因而从分类识别的角度看并不是一种最优变换。2Fisher线性鉴别分析方法(FLD)Fisher线性判别分析(FLD)的基本思想是寻找一个投影方向,使训练样本投影到该方向时尽可能具有最大类间距离和最小类内距离。后来,人们又将两类问题的FLD方法推广到多类情况,其基本原理是通过寻找一个投影矩阵使得训练样本经投影变换后尽可能具有最大类间散射和最小类内散射。它是在使用PCA方法进行降维的基础上,考虑到训练样本的类间信息。如果说主分量分析获得的特征是原始样本的最佳表示特征集,那么,线性判别分析获得的特征是原始样本的最佳判别特征集,该特征集更利于提取高可分性的特征。设模式类别有c个:w1,w2,...wc,每类有训练样本in个,X为n个训练样本1X,…nX的集合。每一类的均值从及总体样本的均值分别为kxiiXnik1(5)knkXn11(6)样本类内离散度矩阵wS为:iciwSS1(7)其中iS为第i类样本的离散度矩阵:TikikxiXXSik))(((8)样本的类间离散度矩阵Sb为:TiicibS))((1(9)Fisher鉴别函数定义为:wSwwSwwJwTbTF)((10)其中w表示从原始样本空间到Fisher空间变换向量。3线性特征提取方法的比较PCA方法是一种最小均方意义上的最优变换,它的目标是去除输入随机向量之间的相关性,以突出原始数据中的隐含特性。其优势在于数据压缩以及对多维数据进行降维。但PCA方法在对数据的处理过程中是根据观测数据的协方差矩阵进行计算的,只涉及到信号数据协方差矩阵,即二阶统计特性,并未考虑到信号数据的高阶统计特性,所以变换后的数据间仍有可能存在高阶冗余信息,实际上数据的高阶统计特性往往包含更重要的特征信息。Fisher线性鉴别是基于样本类别进行整体特征提取的有效方法。它是在使用PCA方法进行降维的基础上,考虑样本的类间信息。PCA的一个主要的不足之处在于样本类间离散度增大的同时,会导致样本类内离散度增大,而FLD在最大化类间距离的同时最小化类内距离。FLD的基本原理就是找到一个最合适的投影轴,使各类样本在该轴上投影之间的距离尽可能远,而每一类内的样本的投影尽可能紧凑,从而使分类效果达到最佳,它是进行图像整体特征提取的有效方法,有着广泛的应用。投影寻踪(projectionpursuit,PP)是用来分析和处理高维观测数据,尤其是处理来自非正态总体的高维数据的一种统计方法。PP的基本思想是把高维数据投影到1-3维子空间上,寻找出能够反映原来高维数据的结构或特征的投影,以达到研究、分析高维数据的目的。PP方法的不足之处体现在计算量大和处理非线性能力弱。(2)非线性特征提取方法无论是前面介绍的主成分分析还是Fisher鉴别方法都是线性特征提取方法,它们一般只适用于线性可分的模式。但实际应用中,许多模式并非线性可分,因此,线性特征提取方法并不理想。为了解决非线性模式的有效特征提取问题,一种可行的办法是对一些线性方法进行相应的非线性扩展。近年来,随着统计学习理论,特别是支持向量机SVM方法的问世,通过再生核理论对一些线性算法进行非线性扩展己成为研究非线性特征提取方法的一种非常重要的手段。下面将对核方法的原理进行介绍:从具体操作过程上看,核方法首先采用非线性映射将原始数据由数据空间映射到特征空间,进而在特征空间进行对应的线性操作。由于运用了非线性映射,且这种非线性映射往往是非常复杂的,从而大大增强了非线性数据处理的能力。核方法的缺点:各特征的物理意义很不明确,一般的线性方法仅是原有各特征的线性叠加,还可以勉强找出其含义,而核方法是不可能明确其物理意义的;求投影所需的计算相对要难得多;测试样本在F空间向量上的投影太复杂。第一个不足从目前看是不可克服的,因为这一不足是由非线性变换引起的,而核方法必须经过非线性变换。后两个不足实际上涉及的是同一个问题,即如何减少表达式中所使用的样本数目。由此可见,如何从学习样本集中选择最具代表性的学习样本是核方法的一个研究方向,或许主动学习(activelearning)是解决这两个问题的一条有效途径。目前,核方法中的核函数主要包括线性核、P阶多项式核和径向基函数(RBF)核等。不过,在实际应用中,到底选择什么样的核函数才能最好地变换或表达该问题,还是一个尚未解决的问题。随着支持向量机理论的提出,基于核的学习方法己逐渐受到人们的重视。核学习己经远远超越SVM范畴,形成了一个相对独立的研究方向,并走向更为厂-阔的舞台。核方法的中心思想是,在进行分类等数据处理时,对于线性不可分打本,首先通过一个非线性映射将原空间样本映射到高维特征空间(也称核空间)中,使核空间中的样本变得线性可分,或者近似线性可分,然后在核空间中用线性方法对其进行处理,从而实现相对于原空间进行非线性的处理,其效果相当好。研究者相继提出了核主成份分析(KPCA)以及针对两类的FLD问颗棵出了核Fisher判别分析(KFLD)等等。4.小结本文主要讨论了目标识别中的特征提取问题,并着重研究了线性与非线性特征提取的方法。而现在由于图像处理的数据量和数据维数的增大,研究图像特征提取的更加优化的算法显得更加重要。而研究人员也在本文中提到的相关算法上提出了优化的算法,如2DPCA及分块2DPCA算法、分块Fisher线性鉴别方法等。这些算法的提出使得图像特征的提取能够快速、准确,为其应用于实践中起到了巨大的推进作用。由于楔形波逼近过程是自底向上的过程,不可避免计算时间较长,如何改进呢楔形波的逼近算法,使其计算时间缩短,还有待于做进一步深入研究,虽然基于楔形波变换域的边缘检测的方法效果比较明显,但是对微弱边缘和细小边缘的检测效果仍然是不够理想的,如何更好的对它们检测这都是需要有待于做进一步深入研究。只要这些不足通过研究得到解决那么楔形波在图像处理中体现出来的未来价值是显而易见的。总而言之图像特征的提取是图像处理领域中很重要的内容,也有着广泛的应用前景。参考文献[1]LinCH,ChenRT,ChanYK.Asmartcontent-b
本文标题:图像特征提取方法概述
链接地址:https://www.777doc.com/doc-2558550 .html