您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 国内外标准规范 > 基于PCA的人脸识别研究报告
项目名称:基于PCA的人脸识别算法研究摘要随着人类社会的进步,以及科技水平的提高,一些传统的身份认证的方法逐渐暴露出各种问题,因此人们需要采用一种更加可靠安全的身份认证方法。毫无疑问人体的生物特征的独一无二的,特别是其不容易丢失及复制的特性很好满足了身份识别的需要。并且随着计算机科学技术和生物医学的发展使得利用生物特征识别成为了可能。因此基于指纹、人脸、视网膜等生物特征的识别方法也越来越多。由于人脸识别的操作快速简单,结果直观,准确可靠,不需要人的配合等优点已成为人们关注的焦点。主成分分析(PCA)法通过提取高维度的人脸图像的主元,使得图像在低维度空间中被处理来降低了图像处理的难度。由于其有效的解决了图像空间维数过高的问题,已经成为人脸识别领域非常重要的理论。此次研究的就是基于PCA的人脸识别算法的实现。本文按照完整人脸识别流程来分析基于PCA的人脸识别算法实现的性能。首先使用常用的人脸图像的获取方法获取人脸图像。本文为了更好的分析基于PCA人脸识别系统的性能分别选用了Essex人脸数据库和ORL人脸库,并在后期采用了自建的人脸库。接下来是人脸图像预处理方法。由于采用的人脸图像质量较好,而且已经做过相应的预处理,所以本文试验中只使用灰度处理。接着使用PCA提取人脸特征,使用奇异值分解定理计算协方差矩阵的特征值和特征向量以及使用最近邻法分类器欧几里得距离来进行人脸判别分类。在实验中我们发现基于PCA的人脸识别系统的识别率很高,而且具有一定鲁棒性,所以基于PCA的人脸识别算法的实现的研究还是有意义。【关键词】人脸识别PCA算法奇异值分解定理欧几里得距离ABSTRACTWiththedevelopmentofscienceandtechnology,theprogressofhumansociety,thetraditionalidentificationiseasytolose,easytobecrackedandithasnotplayanidentifiablerole.Peopleneedamoresecureandreliableidentificationtechnology.Biometricisunique,easytoloseandreplicationcharacteristicsofgoodmeettheneedsoftheidentification.Withthedevelopmentofcomputerscienceandtechnologyandbiomedicalmakesuseofbiometricidentificationhasbecomepossible.Inthefieldofbiometricidentification,facerecognitionwiththeadvantagesofoperationisfastandsimple,theresultsareintuitive,accurateandreliable,donotneedco-ordination,hasbecomethefocusofattention.Theprincipalcomponentanalysis(PCA)toextracthighdimensionalfaceimageofthemainelement,makingtheimagesareprocessedinlow-dimensionalspaceanditreducesthedifficultyofimageprocessing.PCAsolveseffectivelytheproblemofhighdimensionimagespaceandithasbecomeaveryimportanttheoryinfacerecognitionfield.Thispaperisinthiscontextofwritingfrom.InaccordancewiththefullrecognitionprocesstoanalyzetheperformanceofPCA-basedfacerecognitionalgorithm.Thefirsttousethemethodofaccesstocommonlyusedfaceimagesforfaceimages.InordertobetteranalysisisbasedontheperformanceofthePCAfacerecognitionsystemselectedEssexfacedatabase.Nextisthefaceimagepreprocessingmethods.Essexfaceimagequalityisbetter,andhavedonetheappropriatepretreatment,usingonlygray-scaleprocessingofthistrial.ThenusethePCAforfacefeatureextractionusingsingularvaluedecompositiontheoremtocalculatethecovariancematrixoftheeigenvaluesandeigenvectors,andusetheEuclideandistanceofthenearestneighborclassifiertotheclassificationofhumanfacediscrimination.Intheexperiment,wefoundthatahighrecognitionrateofthePCA-basedfacerecognitionsystem,butwithacertainrobustness,thePCA-basedfacerecognitionalgorithmtoachievemeaningful.【Keywords】facerecognitionPCAalgorithmSVDEuclideandistance前言随着社会和科技的发展,社会步伐的加快,人们对高效可靠的身份识别需求日益强烈。各种技术在科研和实际中都受到了很大的重视和发展。由于生物特征内在的稳定性和唯一性使其成为了作为身份识别的理想依据。人脸特征作为典型的生物特征外,还有隐蔽性好,易于被用户接受,不需要人的配合等优点。现已成为了身份识别领域研究的热点。PCA算法通过降低维度,提取主元素,减少了数据冗余,解决了图像纬度太高无法处理或处理很慢的特点,同时保持了原始图像的绝大部分信息。在人脸识别领域,很多先进的识别算法都是在其基础上的改进。所以研究基于PCA的人脸识别算法实现具有重要的理论和使用价值。本文主要介绍基于PCA的人脸识别算法的实现,先介绍了PCA算法的理论基础,其次介绍了其在数字图像领域的应用,最后结合具体研究详述了研究过程。第一节主成分分析基本理论一、什么是主成分分析?主成分分析为Principlecomponentanalysis[10,11,12]的中文翻译,其英文简写为PCA。它是一种非常流行和实用的数据分析技术,最重要的应用是对原有数据进行简化。主成分分析可以有效的找出数据中最“主要”的元素和结构,去除噪声和冗余,将原有的复杂数据降维处理,揭示出隐藏在复杂数据背后的简单结构。它的优点是简单,而且无参数限制,可以方便的应用与各个场合。因此应用极其广泛,从神经科学到计算机图形学都有它的身影。PCA被称为应用线形代数最有价值的结果之一。二、基变换从线形代数的角度来看,PCA的目标就是使用另一组基去重新描述得到的数据空间。而新的基要能尽量揭示原有的数据间的关系。在这个例子中,沿着某x轴上的运动是最重要的。这个维度即最重要的“主元”。PCA的目标就是找到这样的“主元”,最大程度的去除冗余和噪音的干扰。1.标准正交基标准正交基表现了数据观测的一般方式。在线形代数中,这组基表示为行列向量线形无关的单位矩阵。12100010001mbbBIb(4.2)2.基变换从更严格的数学定义上来说,PCA回答的问题是:如何寻找到另一组正交基,它们是标准正交基的线性组合,而且能够最好的表示数据集?在PCA方法中有一个很关键的假设:线性。这是一个非常好的假设,它使问题得到了很大程度的简化,具体表现为数据被限制在一个向量空间中,能被一组基表示,并且还隐含的假设了数据间的连续性关系。这样一来数据就可以被表示为各种基的线性组合。令X表示原数据集。X是一个m*n的矩阵,它的每一个列向量都表示一个时间采样点上的数据X。Y表示转换以后的新的数据集表示。P是他们之间的线性转换。它们间的转换关系为PXY(4.3)有如下定义:pi表示P的行向量。xi表示X的列向量。yi表示Y的列向量。上式(3)在线性代数中,它有如下的含义:P是从X到Y的转换矩阵。几何上来说,P对X进行旋转和拉伸得到Y。P的行向量,(p1,p2,…,pm)是一组新的基,而Y是原数据X在这组新的基表示下得到的重新表示。下面是对最后一个含义的说明:11nmpPXxxp(4.4)1111nmmnpxpxYpxpx(4.5)注意到Y的列向量:1iimipxypx(4.6)可见yi表示的是xi与P中对应列的点积,也就是相当于是在对应向量上的投影。所以,P的行向量事实上就是一组新的基。它对原数据X进行重新表示。3.问题在线性的假设条件下,问题转化为寻找一组变换后的基,也就是P的行向量(p1,p2,…,pm),这些向量就是PCA中所谓的“主元”。问题转化为如下的形式:怎样才能最好的表示原数据X?P的基怎样选择才是最好的?解决问题的关键是如何体现数据的特征。那么,什么是数据的特征,如何体现呢?三、协方差衡量如何选择最优的P基需要借助协方差来进行衡量和判断:21()()1niiiABaabbn(4.9)A,B分别表示不同的观测变量所记录的一组值,在统计学中,由协方差的性质可以得到:20AB,且20AB当且仅当观测变量A,B相互独立。22ABB,当A=B等价的,将A,B写成行向量的形式:12[,,...,]nAaaa,12[,,...,]nBbbb协方差可以表示为211TABABn(4.10)那么,对于一组具有m个观测变量,n个采样时间点的采样数据X,将每个观测变量的值写为行向量,可以得到一个m*n的矩阵:1mxXx(4.11)接下来定义协方差矩阵如下:11TXCXXn(4.12)111212122112222222222mmmmmmxxxxxxxxxxxxXxxxxxxC(4.13)容易发现协方差矩阵具有如下性质:○1CX是一个m*m的平方对称矩阵。○2Cx对角线上的元素是对应的观测变量的方差。○3非对角线上的元素是对应的观测变量之间的协方差。协方差矩阵CX包含了所有观测变量之间的相关性度量。更重要的是,根据前两部分的说明,这些相关性度量反映了数据的噪音和冗余的程度。在对角线上的元素越大,表明信号越强,变量的重要性越高;元素越小则表明可能是存在的噪音或是次要变量。在非对角线上的元素大小则对应于相关观测变量对之间冗余程度的大小。一般情况下,初始数据的协方差矩阵总是不太好的,表现为信噪比不高且变量间相关度大。PCA的目标就是通过基变换对协方差矩阵进行优化,找到相关“主元”。那么,如何进行优化?矩阵的那些性质是需要注意的呢?协防差矩阵的对角化总结上面的部分可以发现主元分析以及协方差矩阵优化的原则是:1)最小化变量冗余即对应于协方差矩阵的非对角元素要尽量小;2)最大化信号即对应于要使协方差矩阵的对角线上的元素尽可能的大。因为协方差矩阵的每一项都是正值,最小值为0,所以优化的目标矩阵CY的非对角元素应该都是0,对应于冗余最小。所以优化的目标矩阵CY应该是一个对角阵。即只有对角线上的元素可
本文标题:基于PCA的人脸识别研究报告
链接地址:https://www.777doc.com/doc-4764822 .html