您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 国内外标准规范 > 基于PCA算法的人脸性别鉴别南山学报
第8卷基于PCA算法的人脸性别鉴别2011年5月作者简介:柳华(1984–),女,山东乳山人,烟台南山学院软件工程学院,教师基于PCA算法的人脸性别鉴别柳华(烟台南山学院,山东烟台,265713)摘要:人脸的性别分类是指根据人脸的图像判别其性别的模式识别问题。本文首先通过主成份分析(PCA)算法求出训练样本的特征子空间,测试样本和训练样本分别向特征子空间投影,分别得到一组坐标系数做为待识别的特征。最后利用最近邻准则进行性别鉴别。在人脸数据库ORL(OlivettiResearchLaboratory)进行实验,实验结果得出,基于PCA算法的人脸性别识别,识别性能好,是一种有效的性别鉴别方法。关键词:性别识别;PCA算法;ORL人脸数据库中图分类号:TP391.41文献标志码:AGenderClassificationBasedonPCAforFacialImagesLIUHua(YantaiNanshanUniversity,Yantai,Shandong,265713)Abstract:Genderclassificationisapatternrecognitionproblemofdecidingthegenderaccordingtothefaceimage.Featuresub-spaceoftrainingsamplesisobtainedbyPCA(PrincipalComponentsAnalysis).Thetestsamplesandtrainingsamplesarerespectivelyprojectedtothefeaturespace,recognitionfeaturesareaccordinglygainedbyasetofcoordinatescoefficient.Thenearestneighborruleisutilizedingenderclassification.ExperimentalresultsonORLfacedatabaseshowthatPCAiswellinrecognitionperformance,andisavalidmethodingenderclassification.Keywords:genderclassification;PCAalgorithm;ORLfacedatabase在计算机识别与监控中,计算机视觉发挥着重要的作用,出现了人脸识别和跟踪、年龄估计以及性别识别等研究领域。其中,人脸性别识别是一个重要的研究课题,即利用计算机通过人脸图像信息识别被观察者的性别属性。各国研究人员都对该课题做了相关的研究,他们采用不同的识别方法,其中大多数研究者采用基于神经网络和基于支持向量机的方法[1-4]。性别识别作为人机交互的一部分,起着非常重要的作用,该项研究不仅能加强现有的人机交互能力,而且还能在智能环境中对一些有性别要求的特定场所的出入进行性别限制,统计性别信息等。人脸图像在计算机中以高维的矩阵存储,人脸图像上的点用矩阵的行和列标出,该点的灰度等级就是矩阵中相应元素的值,从而,性别识别的问题就相当于对高维的矩阵进行处理,所以,达不到实时识别的要求,速度比较慢[5-6]。对于解决这一问题,我们通常采用的方法是利用降维技术,线性鉴别分析(LinearDiscriminantAnalysis,LDA)和主成分分析(PrincipalComponentsAnalysis,PCA)[7],是常用的两种有效的降维方法。本文采用PCA算法进行人脸性别识别,PCA算法的原理就是将一个高维的向量通过一个特殊的特征向量矩阵,投影到一个低维的向量空间中,表征为一个低维向量,这样就可以提高性别识别的速度,由于男女性别人脸之间存在差异性,并且男性或女性人脸结构存在相似性,所以在高维空间中人脸图像的分布是存在着某种规律的。因此,在性别识别过程中,PCA算法将人脸图像空间降维到维数2×2的特征子空间中,这样维数大大减少,并且还保留了原始图像数据的大部分有用的信息,实验结果说明:该算法对表情变化或者轻微倾斜的人脸图像进行性别识别有较强的鲁棒性,并且具有较高的正确识别率和识别速度。1PCA算法原理PCA算法是统计模式识别中一个经典的第8卷烟台南山学院2011年5月特征提取方法,PCA算法的原理是通过除去数据间的相关性达到降维的目的。在PCA中,一幅人脸图像用一个n维向量x来表示,n的大小等于人脸图像的高乘以宽。训练集由进行完规一化后的标准人脸图像来组成。产生矩阵用该样本集的总体散布矩阵即:101TNiiiyyN(1)上式中,yi表示第i个训练样本的图像向量,表示训练样本集的平均向量,N为训练样本的总数。下一步就是求上式矩阵的特征值和特征向量,然后将特征值从大到小排序,取其前m个特征值对应的特征向量,由这些特征向量构成特征子空间。这样,原始向量的维数就降低到m维了,起到了降维的目的,其中,越大的特征值对应的特征向量包含的识别特征越多,能量越大,然后可以将变换后的原始向量投影到特征向量组成的子空间中,得到一组坐标系数,待识别的图像向量也向其投影得到另外一组图像系数,最后通过最近邻准则识别人脸性别。2基于PCA算法的人脸性别鉴别PCA算法用于人脸性别鉴别,首先求的所有训练样本的均值,然后分别求的男,女两类训练样本的均值,下一步对两类训练样本进行规范化,求的规范化后的矩阵的特征向量。这样,就得到了训练样本的特征子空间,然后,将训练样本和测试样本进行规范化再分别朝由训练集生成的特征子空间投影,然后用最近邻准则对性别进行鉴别。下面是该算法的详细过程。首先求得所有训练样本的均值,然后用这个平均值去规范化男女两类训练样本均值。设训练样本图像的高和宽是m和n,则训练样本的维数是m×n,性别识别问题是两类模式识别问题,所以共有2类,设每类参加训练的样本数是M,则所有的样本数就是2×M,然后计算所有训练样本的平均值m2112MimxM,(2)其中xi∈Rm×n然后计算女的训练样本的均值m1111MimxM(3)男的训练样本的均值m2211MimxM(4)其中m、m1、m2∈Rm×n。然后将m、m1、m2转变成列向量。下一步求的训练样本的总体协方差矩阵定义为21()()TiiiSmmmm(5)其中S∈Rmn×mn其中:设X=[m1-m,m2-m]。计算S的特征值与特征向量,将计算的特征向量标准正交化之后记为Ui,则Ui∈Rmn×2,这样训练样本和测试样本的人脸图像就可以投影到Ui∈Rmn×2,张成的子空间中分别获得一组坐标系数,该坐标系数就代表了在特征子空间中的位置,在特征子空间中也就是一个点,该点就代表一幅人脸图像,同时,把Ui∈Rmn×2中的每个列分量还原重构成图像,特别像人脸,所以该方法也称为“特征脸”方法。由于(5)式中S∈Rmn×mn的维数太大,直接求其的特征值和正交归一特征向量有一定的难度,所以下面利用奇异值分解原理来求解(5)式的特征值和特征向量:211()()TiiiSmmmm(6)奇异值分解原理是通过求解上式S1的特征值和特征向量来间接获得S的特征值和特征向量。过程是:首先求的矩阵S1的2个非零特征值2,1ii,Vi为S1矩阵对应于i的特征向量,那么求矩阵S的正交归一特征向量通过下式获得第8卷基于PCA算法的人脸性别鉴别2011年5月2,11iXVUiii(7)上式中的X的定义与公式(5)中相同。这就是总离散度矩阵S的特征向量。第三步,用所有训练样本的平均值规范化两类训练样本均值得到的训练样本矩阵X向特征子空间Ui投影:TiYUX(8)这样就得到了男女两类的投影特征,显然投影特征的维数是2维的,这样就将一个m×n维的训练样本类图像降维到2维空间中了,数据量得到压缩,识别速度也会大大提高。第四步,进行测试识别,经过以上步骤得到PCA算法的性别训练的特征子空间,根据PCA的原理首先需要对待测试的人脸图像向量化,转化为列向量,然后再用训练样本的平均值对其规范化。设测试样本为xTTTxxm(9)利用公式(8)求出测试样本的投影特征C,再计算C与Y之间的欧氏距离d)21,21(),(21212jiCYCYCYdjjijii(10)Yij表示i类训练样本投影特征的第j个元素,Cj表示测试样本投影特征的第j个元素比较d(Y1,C)与d(Y2,C)的大小,若d(Y1,C)小则判为女性,反之,则判为男性。3实验结果与分析实验在Matlab6.5环境下采用ORL人脸数据库的部分样本进行了仿真实验。ORL人脸库是由英国剑桥Olivetti实验室从1992年4月到1994年4月期间拍摄的一系列人脸图像组成,该人脸库由40个不同年龄、不同种族的对象组成、其中,35人为男性,5人为女性。每个对象10幅图像共计400幅灰度图像组成,人脸图像的尺寸为11292,对象的灰度级为256的人脸图像组成,试验中将每幅图像的分辨率转化为5646,库中的人脸包括不同光照、不同面部表情和面部遮挡情况下的人脸图像,同时也包括轻微旋转下的人脸图片。该库是目前使用最广泛的标准数据库,ORL人脸数据库中的部分图像如图1所示。图1ORL人脸数据库中十个人的人脸图像在实验过程中,选取图1中的5男5女共10人,每人10幅图像作为样本图像数据。训练样本随机产生,在相同实验条件下,从男女两类中每人随机选取i张人脸图像作为训练样本(i=2,4,6),每人剩余10-i张作为测试图像来实验。通过采用不同数量的训练样本来测试正确识别率,参加训练的样本数与男、女、和总的平均识别率关系如表1所示。表1训练样本数与正确率%训练样本数总识别率男识别率女识别率2096.2510092.54096.6610093.36097.2510095实验结果证明,基于PCA算法的人脸性别鉴别总体上能达到较高的识别要求,同时通过表1可以看出随着训练样本的增加,PCA算法的识别率也随之就越高。同时还可以看出相同的训练样本数的情况下,男性的识别率高于女性的识别率。这个实验结果是偶然还是女性比男性难识别,经查阅文献,研究结果:女性化程度取决于漂亮程度,而男性化程度与漂亮程度无关,并且人脸图像越趋近于平均脸,越漂亮,女性化程度越高,这样的就容易造成错误识别率,这结论能很好的解释这个问题,至于该问题是否还与其他因素有关系,还需进一步研究。4结论性别分类是一个很具有挑战性的实际问题。本文采用的是基于PCA算法的人脸性别识别。PCA算法将训练图像和测试图像都投影到PCA算法得到的特征子空间里,通过这个算法的处理变换,保留下了人脸图像的对性别识别有用的信息,同时也去掉了与性别识别无关的大量的图像的冗余信息,起到了降维的作用,该算法有较高的识别率和识别速度。但是该算法是对人脸的灰度图像进行处理变换的,所以最大的缺陷是对光照很敏感,从而影响识别率,这个问题有待进一步探讨研究,同时,下一步的研究可以采用PCA提取主成分信息,第8卷烟台南山学院2011年5月作为性别分类的特征,然后利用支持向量机(SVM)、Adaboost算法进行性别分类,进一步提高识别率。参考文献:[1]邓英,欧贵文.基于HMM的性别识别[J].计算机工程与应用,2004(15):74-75.[2]李小红.基于积分投影的人脸图像的特征提取[J].计算机仿真,2004,21(12):189-191.[3]张淑玲,邹复民.基于小波分析的人脸图像特征提取[J].科学技术与工程,2006,6(12):1719-1722.[4]孙权森,增生根,王平安,等.典型相关分析的理论及其在特征融合中的应用[J].计算机学报,2005,28(9):1524-1533.[5]何国辉,甘俊英.PCA-LDA算法在性别鉴别中的应用[J].计算机工程,2006,32(19):208-213.[6]李月龙,尹建芹,李金屏.一种人脸识别的新方法[J].济南大学学报:自然科学版,2006,20(4):315-317.[7]边肇祺,张学工.
本文标题:基于PCA算法的人脸性别鉴别南山学报
链接地址:https://www.777doc.com/doc-2571205 .html