您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 商业计划书 > 浅析矩阵分解的原理及其在人脸识别中的应用
浅析矩阵分解的原理及其在人脸识别中的应用摘要:矩阵分解方法有多种,本文首先对矩阵的分解方法做了简单的介绍,这些分解在数值代数和最优化问题的解决中都有着十分重要的角色以及在其它领域方面也起着必不可少的作用。人脸识别是指采用机器对人脸图像进行分析,进而提取有效的识别信息从而达到身份辨认的目的。近年来因其在安全、认证、人机交互、视频电话等方面的广泛应用前景而越来越成为计算机模式识别领域的热点。本文在分析矩阵分解的原理后详细针对其在人脸识别中的应用做了一些初步认识的总结。关键词:矩阵分解QR分解奇异值分解非负矩阵分解人脸识别矩阵是数学中最重要的基本概念之一,是代数学的一个主要研究对象,也是数学研究及应用的一个重要工具。在近代数学、工程技术、信息处理、经济理论管理科学中,也大量涉及到矩阵理论的知识,矩阵分解是指根据一定的原理用某种算法将一个矩阵分解成若干个矩阵的乘积或者一些矩阵之和。这些分解式的特殊形式,一是能明显地反映出原矩阵的某些特征;二是分解的方法与过程提供了某些有效的数值计算方法和理论分析依据。人脸识别是指采用机器对人脸图像进行分析,进而提取有效的识别信息从而达到身份辨认的目的。虽然人类能轻松地识别出人脸,但人脸的自动机器识别却是一个难度极大的课题,它涉及到图像处理、模式识别、计算机视觉和神经网络等学科,也和对人脑的认识程度紧密相关。现在矩阵分解在人脸识别中应用很广泛,有不同的算法来实现,本文将对现有的算法做总结和比较。1矩阵的分解方法矩阵分解(decomposition,factorization)是将矩阵拆解为数个矩阵的乘积,可分为三角分解、满秩分解、QR分解、Jordan分解和SVD(奇异值)分解等,常见的有三种:1)三角分解法(TriangularFactorization),2)QR分解法(QRFactorization),3)奇异值分解法(SingularValueDecomposition)。1.1矩阵的三角(LU)分解LU分解,设A=()是n阶可逆矩阵,如果A的对角线下(上)方的元素全为零,即对ij,=0(对ij,=0),则称矩阵A为上(下)三角矩阵,上三角矩阵和下三角矩阵统称为三角矩阵。=如果有下三角矩阵L和上三角矩阵U,使得A=LU,则称A能做三角分解,并且称A=LU为A的三角分解或LU分解。1.2矩阵的QR分解矩阵的QR分解(正交三角分解)在解决最小二乘问题、特征值计算、广义逆矩阵的计算方面,都是十分重要的。以下为矩阵的QR分解:设A是n阶可逆实矩阵,则A可惟一分解为A=QR其中,Q为正交矩阵,R是主对角元素都是正数的上三角矩阵。1.3矩阵的满秩分解矩阵的满秩分解是将非零矩阵分解为列满秩和行满秩矩阵的乘积。设A(r0)如果存在矩阵F和G,使得:A=FG则称其为矩阵A的满秩分解。1.4矩阵的奇异值分解奇异值分解在某些方面与对称矩阵或Hermite矩阵基于特征向量的对角化类似。然而这两种矩阵分解尽管有其相关性,但还是有明显的不同。对称阵特征向量分解的基础是谱分析,而奇异值分解则是谱分析理论在任意矩阵上的推广。奇异值分解(SVD)是另一种正交矩阵分解法;SVD是最可靠的分解法,但是它比QR分解法要花上近十倍的计算时间。[U,S,V]=svd(A),其中U和V代表二个相互正交矩阵,而S代表一对角矩阵。和QR分解法相同者,原矩阵A不必为正方矩阵。使用SVD分解法的用途是解最小平方误差法和数据压缩。矩阵的奇异值在最优化问题、特针织问题、最小二乘方向题、广义逆矩阵问题及统计学等方面都有重要的作用。设A,则存在m阶酉矩阵U和n阶酉矩阵V,使得其中E=diag(),而为A的正奇异值,称为A的奇异值分解。2矩阵分解在人脸识别中的应用2.1矩阵分解应用于人脸识别的发展历史人脸识别的研究可以追溯到20世纪60年代,近20年来得到了迅速发展,涌现出了很多新的方法。这些方法的有效性很大程度上取决于它们所提取的人脸特征。目前可利用人脸特征可分为四类:视觉特征,统计特征,变换系数特征和代数特征等。其中,代数特征被认为是人脸的本质特征,表征了人脸图像的内在特性。目前典型的代数特征主要包括奇异值特征和本征脸(Eigenfaces)特征等。本征脸(Eigenfaces)技术比较成熟,但其计算较为复杂,因此国内关于代数特征的研究主要集中于奇异值特征上Hong在文献中首先提出了经典的基于奇异值特征的人脸识别方法,把人脸图像视为一个矩阵,进行奇异值分解从而提取其奇异值特征,并投影到Foley2Sammon最佳鉴别平面进行识别,但在实验中误识率为42.67%,Hong认为是小样本对统计方法的影响。随后许多人提出了消除小样本统计方法的影响的方法,但是这些方法均采用人脸的奇异值特征取代原始的人脸图像。然而最近的研究表明,这是远远不够的,后来的文献中有人发现人脸的奇异值特征只包含了少数有用信息,更多的信息则包含在由两个正交矩阵组成的特征矩阵中,由此提出了在识别时采用将待识别的人脸向每个已知人脸的特征矩阵投影,取投影后得到的系数矢量作为特征同已知人脸的奇异值特征进行比较识别。该方法在ORL人脸库上获得了92.50%的识别率。值得注意的是,投影后得到的系数矩阵一般为非对角矩阵,且非对角线上的系数包含了许多关键的识别信息。2.2QR分解在人脸识别中的应用针对维数压缩中的鉴别信息提取,对一种已有的解决小样本问题的直接线性鉴别分析方法(directlineardiscriminateanalysis。DIDA),利用矩阵的QR分解实现数据的预处理,并且在低维的空间内实现了特征提取,实现算法的实时处理。最后,在ORI人脸数据库上的实验结果验证方法的有效性。维数压缩很重要的一个目的是为了实现样本分类,利用Fisher鉴别准则能在维数压缩过程之中融入样本的鉴别信息,但是小样本问题是在利用Fisher鉴别准则时经常会遇到的问题,直接线性鉴别分析方法是解决此类问题的一个有效鉴别维数压缩方法。在直接线性鉴别分析方法中引入矩阵QR分解的思想,为高维、小样本的有效鉴别信息提取提供了理论框架。QR分解的引入,使得无需处理一个高维的原始样本矩阵。通过分析矩阵的QR分解过程,可以在一个相对低维的空间中实现目标函数的优化.在第一步实现矩阵的目标函数优化之后,可以在一个较小的空间中实现特征提取过程.此时在新的空间之中,最佳鉴别矢量的计算只需在一个最大为Cl(C为样本类别数)维空间中计算,有效降低了计算复杂度和对硬件存储性能的要求。2.3奇异值分解在人脸识别中的应用所有人脸识别方法的有效性都依赖于两方面:特征提取和特征匹配.特征提取,即寻找有效的特征,是解决识别问题的关键所在.用于识别的图像特征有多种,包括视觉特征、统计特征、变换系数特征以及代数特征等.其中,代数特征是由图像本身的灰度分布所确定的,它描述了图像的内在信息,而这种内在信息对增强图像的识别能力是非常重要的.奇异值就是一种很有效的代数特征,所以奇异值分解在数据压缩、信号处理和模式分析等许多方面都获得广泛应用.在某种程度上,奇异值特征同时拥有代数与几何两方面的不变性。由于矩阵的奇异值分解可以看作,把一个秩为k的矩阵分解成一组秩为1的矩阵的加权和,则这样一幅图像就可以表示成如下形式:其中是奇异值,uiviT是SVD的正交基(这里也可以称为图像A的基图像)。尽管对于任何给定的实矩阵A,在,≥≥⋯≥女的限制下,它的奇异值分解式AUΣvr和是唯一的,但相同的奇异值矩阵却可以对应不同的人,也就是说奇异值矩阵与人脸图像并不是一一对应的。对于人脸的识别,仅仅利用奇异值是远远不够的,还要充分利用携带重要信息的正交矩阵。根据SVD定理,这些正交矩阵的列,正好是奇异值对应于AAT和ATA的特征向量。由于每一幅图像都有可能受到光照、姿势、表情等噪声的影响,所以对识别会造成很大干扰。而原始数据矩阵的所有奇异值和特征向量中包含了该数据矩阵的全部信息(也包含了很多干扰信息),同时对于那些有用的信息,每个奇异值和特征向量所包含的能量也是不同的,较大的奇异值及其对应的特征向量包含了较多的能量.本文通过保留SVD中前面部分较大的奇异值及其对应的特征向量,以剔除掉图像中由于光照、表隋、姿势等噪声影响所对应的高频信息,来重构图像,并以之作为一类人的一个模板图像来进行识别。也就是说,首先对奇异值从大到小,进行排列,然后取前m(mk)个较大的奇异值及其对应的特征向量uivi,来重构一幅图像:重构得到的图像A’相当于将原图像A模糊化,从而提取出这一类人有别于其他类人的特征并用于识别。使用人脸数字图像奇异值分解中,前面部分较大的奇异值及其对应的特征向量来重构图像,以剔除原图像中由于光照、表情、姿势等噪声影响对应的高频信息,并将重构图像作为模板进行识别.实验结果表明:一方面,保留奇异值及其对应的特征向量数目越多,对应的识别率越高.随着保留奇异值及其特征向量数目的增加,其对识别的贡献度逐渐降低.另一方面,训练样本的增加,一般可以提高识别率,在训练样本较少时,作用最为明显.但是训练样本过多,有可能会降低识别率。在使用较少的奇异值和训练样本的情况下,仍然取得了相当高的识别率,高于PCA方法。因而,不仅降低了工作量,而且提高了识别率,可谓一举两得.值得提出的是,当仅保留第1个或第2个奇异值及其对应特征向量来进行识别时,单幅图像的识别率就已经达到6O%以上,这是其他方法所无法比拟的。当然,对于奇异值、特征向量在识别中分别所起的具体作用,还有待进一步研究。2.3非负矩阵分解及其在人脸识别中的应用常用的传统矩阵分解方法有:主成分分析(PCA)、独立成分分析(ICA)、矢量量化(VQ)、奇异值分解(SVD)等,其共同点是允许分解后结果出现负值,从计算角度看这是正确的,但就应用角度看负值是没有实际意义的。NMF最成功的一类应用就是用于图像处理领域.图像本身包含大量数据,并在计算机内以矩阵形式存放,而关于图像的识别与处理也均以矩阵形式进行,这就使得NMF方法能够很好的与图像处理相结合,目前它已成为此领域中数据降维和特征提取的一种有效方法。Lee和Seung首次提出NMF理论时,便将其用于人脸识别.Gui.D等提出了基于NMF的人脸识别方法,实验证明,NMF用于人脸识别方面有利于提高识别率。但是在处理大规模图像信息时,NMF也存在许多问题,如丢失一些结构信息、加大计算量等,为此许多学者对其进行了不同方面的改进。高宏娟等将图像矩阵取代传统图像向量表示,提出了一种(2D)‘NMF方法,用来提取二维图像的基本特征,同时还采取了特征正交化和图像变形等措施改善了算法性能,实验验证此法用于人脸识别时精度和速度都得到了提高。宋星光等提出将局部NMF分解(LNMF)用于提取人脸子空间特征,将人脸图像在特征空间上投影,将得到的投影系数作为人脸识别的特征向量,以进行人脸识别.该方法在一定程度上提高了识别塞。杨轩提出了一种基于gamma分布的NMF算法(GNMF),在此算法的基础上构建特征子空间,采用最小距离分类法对ORL人脸库中的部分图像进行识别。实验表明,以GNMF为基础的人脸识别方法识别率较高。欧阳怡彪等提出了基于小波和非负稀疏矩阵分解的人脸识别方法.该方法利用小波变换(wT)、非负稀疏矩阵分解(NMFs)和Fisher线性判别法(FLD)来进行人脸识别.实验表明,此法对人脸表情、光照变化和部分遮挡不敏感,具有非常好的健壮性和较高的识别率。此外,许多国外学者也致力于将NMF用于人脸识别方面的研究,并取得了显著的成果。NMF算法作为一种专门对于非负矩阵处理的矩阵分解方法,可以实现对非负矩阵的线性分解.同时保持矩阵的非负特性。其基本思想是对非负数据进行线性非负分解,由于人脸图像数据的非负性,在人脸识别中采用非负矩阵分解成为了一种避开神经网络,避开支持向量的一种新兴的研究方法。目前NMF算法研究虽取得了一些成果,但尚处于起步阶段。一些非常有意义的问题还有待被探讨和解决。3结束语上述内容主要介绍了几种矩阵的分解原理及其在人脸识别中的基本应用。罗列出矩阵分解的定义、性质以及定理等。矩阵理论是数学的一个重要
本文标题:浅析矩阵分解的原理及其在人脸识别中的应用
链接地址:https://www.777doc.com/doc-2311364 .html