您好,欢迎访问三七文档
1.1人脸识别的主要方法目前,国内外人脸识别的方法很多,并且不断有新的研究成果出现。人脸识别的方法根据研究角度的不同,有不同的分类方法。根据输入图像中人脸的角度不同,可以分为正面,侧面,倾斜的人脸图像的识别;根据图像来源的不同,可分为静态和动态的人脸识别;根据输入图像的特点,又可分为灰度图像和彩色图像的人脸识别等等。本文重点研究基于正面的、静态的灰度图像的识别方法。对于静态的人脸识别方法从总体上看可以分为三大类:一是基于统计的识别方法,主要包括特征脸(Eigenface)方法和隐马尔科夫模型(HiddenMarkovModel简称HMM)方法等;二是基于连接机制的识别方法,包括人工神经网路(ArtificalNeuralNetwork简称ANN)方法和弹性图匹配(ElasticBunchGraphMatching简称EBGM)方法等;三是一些其他的综合方法及处理非二维灰度图像的方法。下面分别进行介绍。1.1.1基于特征脸的方法特征脸方法[5],又称为主成份分析法(PrincipalComponentAnalysis简称PCA),它是20世纪90年代初期由Turk和Pentland提出的,是一种经典的算法。它根据图像的统计特征进行正交变换(即K-L变换),以消除原有向量各个分量之间的相关性。变换得到对应特征值依次递减的特征向量,即特征脸。特征脸方法的基本思想是将图像经过K-L变换后由高维向量转换为低维向量,并形成低维线性向量空间,利用人脸投影到这个低维空间所得到的投影系数作为识别的特征矢量。这样,就产生了一个由“特征脸”矢量张成的子空间,称为“人脸子空间”或“特征子空间”,每一幅人脸图像向其投影都可以获得一组坐标系数,这组坐标系数表明了人脸在子空间中的位置,因此利用特征脸方法可以重建和识别人脸。通过人脸向量向特征子空间作投影得到的向量称之为主分量或特征主分量。主分量特征具有如下性质:(1)主分量特征具有很强的信息压缩能力。(2)对于任何属于样本空间的人脸模式都有唯一的主分量特征与之相对应。(3)主分量特征具有稳定性。即当输入的人脸模式向量有微小变化时,其对应的主分量特征变化将小于输入模式的变化。这一点对于模式的分类是非常有利的。(4)经过变换矩阵的映射,随着空间维数的降低,模式之间的距离也得以缩小,从而避免了在高维空间中进行分类的复杂性由于PCA方法主要是利用了K-L变换,因此它具有良好的稳定性、位移不变性、特征向量与图像的高度成比例变化以及转置不变性,且K-L变换是统计最优的、具有速度快,实现方便、对正面图像识别率高等特点,但是特征脸的不足之处是容易受人脸姿态和表情,光照改变及位移改变等因素的影响。为了克服这些缺点,研究人员提出了许多改进方案,如Bartlett等采用独立分量分析(ICA,IndependentComponentAnalysis)的方法识别人脸;将特征脸与线性判别函数相结合的Fisher脸方法等。现在还出现了很多其他子空间的人脸识别方法,如借鉴SVM的Kernel方法,PCA,IDA等都被扩展到KernelPCA和KernelICA等等。从以上介绍不难发现,利用特征脸方法进行人脸识别有其他人脸识别方法无法取代的优势,因此在人脸识别领域,特征子空间的方法仍是人们研究的一个热门方向。1.1.2基于几何特征的人脸识别方法基于几何特征的方法,有时也称为结构匹配方法,是早期的人脸识别方法[6,7],该方法常采用的几何特征有人脸的五官如眼睛、鼻子、嘴巴等的局部形状特征,脸型特征以及五官在脸上分布的几何特征。因此该方法需要先检测人脸的眼睛,眉毛,鼻子和嘴巴等各种几何特征,然后将特征点的位置,距离和角度等各个特征和相互的联系用作人脸识别的特征。提取特征时往往要用到人脸结构的一些先验知识。在这种基于几何特征的识别中,识别归为特征矢量之间的匹配,其中基于欧氏距离的判决是最常用的识别方法。基于几何特征的识别方法具有如下优点:符合人类识别人脸的机理,易于理解;存储量小,对每幅图像只需存储一个特征矢量;具有光照不变性;模板匹配高识别率等。但这种方法存在如下问题:对强烈的表情变化和姿态变化的鲁棒性较差;从图像中抽取稳定的特征比较困难,特别是特征受到遮挡时。因此一般不单独利用基于几何特征的方法进行人脸识别,而是和其他方法结合使用。1.1.3弹性图匹配的方法弹性图匹配法最早由Lades在1993年提出的[8]。该方法使用一种基于动态链接结构的弹性匹配法来定位人脸,并根据已有人脸数据库进行匹配识别。弹性图匹配法将人脸用格状的稀疏图形描述,图形中的每个节点用图像位置的Gabor小波分解得到的特征向量标记,这些特征向量记录人脸在该顶点位置的分布信息,稀疏图的边用连接节点的距离向量标记,表示连接关系。在进行匹配的时候,先寻找与输入图像的最相似的模型图,再对图中的每个节点位置进行最佳匹配。弹性匹配方法提取了人脸图像的局部特征,同时保留了人脸图像的空间信息,可以在一定程度上容忍人脸从三维到二维投影引起的变形。由于Gabor变换具有局部性、带通性以及方向选择性,能够很好地提取目标的本质特征,对于目标局部变换、小的旋转、以及光照改变等情况都能得到较好的识别。弹性模板的方法考虑了人脸的特征和非刚性,因此该方法的识别率较高,但是计算量非常大识别速度慢。1.1.4基于人工神经网络的方法神经网络方法在人脸识别的应用中有很长的历史,如早期的Kohonen自联想映射网络,后来出现的BP网络、SOM网络等。人工神经网络(ANN)是在对大脑的生理研究成果的基础上,用机器来模拟大脑的某些机理与机制,实现某方面功能的方法,它具有强大的非线性逼近能力。它即可以做特征提取器,又可以做分类器。神经网络中的神经元是对人类大脑神经单元的一种简化,神经网络以这些具有非线性映射能力的神经元为节点,神经元之间通过加权系数连接。目前,比较有代表性的方法有混合型神经网络、卷积神经网络、基于概率决策的神经网络、主元神经网络等。将神经网络应用在人脸识别中,实际上是把模型的统计特征隐含于神经网络的结构和参数中。通过神经网络各神经元之间的相互关系体现人脸特征之间的内部联系。人工神经网络方法的优点很多,如适应性更强、比较容易实现,但其也存在网络难以收敛、训练时间长等问题。神经网络方法在人脸识别上的应用和其他几类方法比较有一定的优势[9],因为对人脸识别的许多规律或规则进行显性的描述是相当困难的,而神经网络方法则可以通过学习的过程获得对这些规律和规则的隐性表达[10],它的适应性更强,一般也比较容易实现。1.1.5基于支持向量机的方法支持向量机(SupportVectorMachine简称SVM)的方法,起源于统计学习理论,它研究如何构造学习机,实现模式分类问题。其基本思想是通过非线性变换将输入空间变换到一个高维空间,在高维空间求取最优线性分类面,以解决那些线性不可分的分类问题。而这种非线性变换是通过定义适当的内积函数(即核函数)来实现的。由于该方法是基于结构风险最小化原理,而不是传统统计学的经验风险最小化,因而表现出很多优于已有方法的性能。但该方法需要大量的存储空间,并且训练速度慢。1.1.6隐马尔可夫模型的方法隐马尔科夫模型(HiddenMarkovModel,HMM)是用于描述信号概率统计特性的一组统计模型。HMM使用马尔科夫链来模拟信号统计特性的变化,而这种变化又是间接地通过观察序列来描述的,因此,隐马尔科夫过程是一个双重的随机过程。在HMM中,节点表示状态,有向边表示状态之间的转移,一个状态可以具有特征空间中的任意特征,对同一特征,不同状态表现出这一特征的概率不同。由于HMM是一个统计模型,对于同一特征序列,可能会对应于许多状态序列,特征序列与状态序列之间的对应关系是非确定的。这种模型对于状态序列来说是隐的,故称为隐马尔科夫模型。隐马尔可夫模型最初用于一维的语音信号,为了把HMM应用于二维的图像,需要在图像上取一个采样窗口,该窗口的宽度就是图像的宽度,高度可能只有几个像素,然后将其在图像上由上至下滑动,相邻窗口之间允许重叠,这样就把人脸垂直分成了五个区域:前额,眼睛,鼻子,嘴巴,下颚,然后用一个五状态的HMM模型来表达人脸。马尔可夫模型的特性主要用“转移概率”来表示。后一状态出现的概率取决于其以前出现过的状态次序。这种方法鲁棒性较好、对不同角度和不同光照条件的人脸图像都可以取得较好的识别效果。该方法实现的复杂度高,且识别效果主要取决于特征定位的准确性。1.1.7其他综合方法以上介绍的是几种典型的人脸识别方法,从分析中可以看出,每种方法都各有其优缺点,因此一些研究者更倾向于将几种或多种方法综合起来,或同时利用不同种类的特征。如文献[11]中将特征脸方法和神经网络方法结合,同时使用统计特征和几何特征进行人脸识别。目前人脸识别研究的对象基本上都是针对二维灰度图像,除此之外,还有深度人脸图像识别和红外人脸图像识别方法及三维可变模型方法等。本文选择当前研究较多的特征脸方法和在人脸识别方面比较有优势的人工神经网络的方法进行研究并对其进行改进。
本文标题:人脸识别的主要方法
链接地址:https://www.777doc.com/doc-4891908 .html