您好,欢迎访问三七文档
当前位置:首页 > 高等教育 > 理学 > 基于人脸识别的数学建模优秀论文3
数学建模校内竞赛论文论文题目:基于PCA和SVM的人脸识别算法1基于PCA和SVM的人脸识别算法摘要由于人脸图像对光照、表情等变化较为敏感,导致人脸图像特征提取,特征分类难度大,人脸识别技术在精度和识别率等方面存在问题。本文针对人脸识别问题设计了行之有效的综合创新算法。它改进了传统的基于几何特征的人脸识别方法,结合人脸的肤色模型使得人脸检测的算法得以简化;使用现今的主成分分析算法,在更低的维度提取了人脸图像的主要特征信息;融合了基于欧氏距离的人脸识别模型和基于支持向量机的人脸识别模型,集成了二者的优点,提高了算法的准确率。针对问题一,设计了一套包括图像预处理,图像特征提取,图像识别判据的综合算法来对人脸进行更有效地识别,识别准确率较高。针对问题二和问题三,分别根据题目要求更新了数据库,并运用问题一的模型,对题目要求的图片进行识别。其中问题二中犯罪嫌疑人的照片被成功识别,问题三中部分不同年龄的照片被识别出来。针对问题四,重点阐述本文设计的算法具有很强的综合性和较好的创新性,从而突出它相对于已有人脸识别算法的优势。关键词:预处理主成分分析法欧式距离支持向量机21.问题重述与人的指纹不同,人脸总是在不断变化的。只是微笑一下,人脸就发生了改变。眼角纹、鼻子的反光点、露出的牙齿,统统都在改变。仰天大笑,脸上显现的形状很快发生变化。即使有同样的表情,人的头发也在不断发生变化,刚理发后的变化更是非常大。然而,人眼却能毫不费力地从一堆照片中认出他认识的人,即使这个人他们只见过一面。题目所给的人脸数据库包含了13000张人脸,共5749个身份,本文需要基于题目所给出的数据库,解决如下问题:(1)设计算法,识别该数据库中的人脸,与人眼识别结果进行比较;(2)对《今日说法》2015年6月27日节目“藏在大衣里的纸条”中的犯罪嫌疑人胡洋进行脸部识别,协助警方破案;(3)判断年龄变化是否会影响该算法的识别结果,并用算例加以说明;(4)与已有人脸识别算法相比我们设计的算法有哪些优势。2.问题分析本题需要我们建立模型设计出算法,实现人脸自动识别。主要有以下几个问题需要解决:识别题目所给数据库中的人脸,对生活中的普通照片和网络照片进行匹配识别,利用算例研究年龄对本算法进行人脸识别的影响,最后,给出本文建立的算法与已有算法相比有什么优势。要解决这些问题,主要的思路就是要建立一个模型和算法,能够自动实现不同状况条件下的人脸识别。3问题一:数据库中每张图片包含的人脸个数不唯一,并且人脸的位置和形状大小等特征差异很大,所以需要先对图片进行预处理,以准确获得完整清晰的人脸图像。由于每张人脸照片的信息量很大,进行识别前需要用主成分分析法提取主要的特征信息。分别采用欧式距离法和基于支持向量机的方法识别数据库中的照片。问题二:要对犯罪嫌疑人进行人脸识别,需要先提取犯罪嫌疑人的照片,并且构建包含其照片的人脸数据库。运用问题一所构建的模型和算法,对其进行人脸识别。问题三:随着年龄的变化,人的脸部特征会发生很大的变化,这使人脸识别的难度加大。数据库中每个人的照片年龄差距很小,需要通过网络途径得到一些不同年龄的照片,通过算例得出年龄对算法的影响。问题四:通过大量地阅读文献,改进本文的算法,得出本文与已有人脸识别算法相比的优势。3.模型的假设与符号的约定3.1模型的假设与说明(1)假设题目所给的数据库中每张照片都必须包含一张完整的人脸(2)假设每张图片上对应的名字都正确(3)假设今日说法视频中出现的照片真实43.2符号的约定与说明编号符号说明1m平均脸列向量2id第i张人脸与平均脸m的差值矢量3C训练样本集的协方差矩阵4z特征脸空间5K支持向量机中训练样本的类别数6图像在特征脸空间的坐标系数7j欧式距离4.模型的建立与求解4.1问题一:设计算法对数据中的人脸进行识别题目所给的数据库包含了13000张人脸,共5749个身份。通过对数据库中的图片进行分析可知,每张图片中人脸的个数不唯一,每个人的脸型大小不同,面部特征不同,并且由于拍摄角度,距离以及拍摄时的光线不同,不同图片中的同一个人的脸所在位置和大小等特征都可能不同。所以人脸识别的第一步就是人脸检测及预处理,即通过一系列预处理,在输入图像中锁定人脸,并准确定位其位置和大小。特征提取是人脸识别过程中重要的过程,本文采用主成分分析法)(PCA进行特征提取。实质是假设所有的人脸都处于一个低维线形空5间,而且不同的人脸在这个空间中具有可分性。具体做法是由高维图像空间经KL变换后得到一组新的正交基,对其进行取舍,保留主要信息生成低维的人脸空间,也即人脸的特征子空间。识别过程是人脸识别最后一步,也是呈现识别结果的过程。本文采取欧式距离法和基于支持向量机法进行识别,并且根据结果对两种方法进行比较。4.1.1图像预处理首先对本题数据库中的图片进行预处理,本文图片预处理主要是基于肤色检测与人脸特征相结合的方法,其主要步骤如下:1Step:光线补偿。由于图片存在光照不均匀的情况,所以在对图像进行处理之前对图片进行光线补偿。即把图片中亮度最大的的像素提取出来,计算这些像素的总灰度值,求得光线补偿系数。根据光线补偿系数把整个图片的亮度进行线性放大。2Step:二值化。经过光线补偿后的图像是具有多个灰度级的单色图像。由于每个人自身的脸部肤色基本一致,且与背景颜色相差很大。为了将人脸区域与背景区域分别开来,便于识别人脸区域,要将这些多值图像转换成只具有黑白两个灰度级的二值图像。3Step:人脸边缘检测。经二值化后的人脸图像中,数值为0的部分表示背景,数值为1的部分表示人脸。运用matlab中的regionprops函数求像素数值1的8连通区域,构建包含像素数值0的最小矩阵,得到人脸的边缘区域。64Step:图像规范化。在3Step中已求得人脸边缘矩阵,运用matlab函数求得其中心坐标,查阅资料得到人脸长宽比例即矩阵大小,将人脸图像规范化,图像大小为110140,如图1所示。(0_1)(0_2)(0_3)原始图像(1_1)(1_2)(1_3)图像规范(2_1)(2_2)(2_3)规范结果7图1图像规范化示意图5Step:中值滤波。中值滤波算法不仅能有效去除图像噪音,尤其是对去除椒盐噪声更加有效,而且能比较好地保留图像边缘的锐度和图像细节特征。中值滤波的效果图如下:图2中值滤波效果图6Step:直方图均衡化。即把一已知灰度概率分布的图像,变换成具有均匀概率分布的新图像的过程。其示意图如下:8图3直方图均衡化结果图把数据库中的13000多张图片全部进行预处理,就得到了13000多张人脸照片,观察结果可知,成功率大于90%,符合预期。4.1.2基于PCA的人脸特征提取模型在人脸识别的科研领域里,如何能够有效地用低维提取和表示出人脸特征的信息一直是研究的热点话题。而作为统计学方法的主成分分析法可以实现这样的功能,所以在人脸识别领域发挥着重大的作用。A平均脸的生成在计算机里每一张图像的存储方式是矩阵的形式,而为了构造人脸向量数据库以方便求出平均脸和特征脸,则需将每一张图像对应的9矩阵转换成列向量。设每张灰度图像的行数为N,列数为M,则灰度图像能够转换为一个N*M行,1列的向量。从图片数据库里选取L张图像,由这L张图像的列向量组成一个n*m行,L列的矩阵T。对矩阵T各个列向量求取平均值得到m,m也为N*M行,1列的向量。由均值m可以还原回N*M的矩阵,从而做出平均人脸的图像。为了能够简单地展示平均人脸的效果,只随机选取图像数据库中的200张图像,生成平均脸的效果如下:图4平均脸这张平均脸平均综合反映了200张人脸图像的信息,并不是普通意义下只针对一个人的人脸图像。B特征脸的生成和投影系数的求取对一张图像进行特征信息提取,往往由于维数过高带来计算困难的难题。而PCA能够基于K-L变换有效地实现对图像降维。经过查阅文献资料,将K-L变换的原理简单地阐述如下:在原图像的测量空间找出一组u个正交矢量,要求这组正交矢量能最大程度地反映出数据方差,然后将原图片模式矢量从w维空间投影到这组正交矢量构成u维子空间,则投影系数为构成原模式的特征矢量,由于要求uw,所以PCA能够实现维数的压缩。为了简洁地阐述投影系数的求取步骤和10特征脸的生成过程,仍然取上文用来生成平均脸的那200张图像。Step1:计算200张图像的平均脸m=20012001iiXStep2:计算每一张人脸图片与平均脸的差别)200…,2,1i(mXdiiStep3:构建协方差矩阵:TiTiiAAdC2001*d20012001Step4:运用奇异值分解求V=AAT的特征值i和正交归一化向量i将特征值i按照从大到小的顺序排列,根据查找的文献资料,选取前P个特征值使它们的和大于90%,然后用选取的p个特征值对应的特征向量构成特征脸空间的转换矩阵,将部分特征脸输出如下:图5部分特征脸这些部分特征脸的每张特征脸都含有200张图片里的多张人脸图像的拓扑信息,所以上面的每一张特征脸不是真正意义的一张人脸图像。接下来通过求取每一张图像在构建的降维特征脸空间下的投影系数,获知该图像在特征脸空间下的位置信息,从而可以作为人脸识别的依据。在如上的操作步骤进行到step4之后,利用奇异值分解的理论可以导出计算协方差矩阵C的前P个特征向量的公式:11p)…,2,1(1,iiiAQi.则“特征脸”空间为z=(p2,1Q…,QQ).最后将每一幅人脸与平均脸的差值矢量投影到“特征脸”空间,即5)…,2,1(zidiT。用Matlab编写程序即可以求解各个人脸图像投影到特征脸空间的坐标系数。4.1.3基于欧式距离的人脸识别模型根据前面基于PCA的人脸特征提取模型可以得到降维的“特征脸”空间,则每个预存人脸图像和待识别人脸图像都可以投影到特征脸空间得到一个对应的坐标,按照欧式距离的计算方法计算待识别人脸图像与预存数据库中的人脸图像的距离,将距离最小的预存人脸图像输出作为识别的结果。据此,可以总结出基于欧式距离的人脸识别模型的算法流程图如下:图6基于欧式距离的人脸识别算法流程图待识别的人脸图像投影到特征脸空间,得到待识别的第j张人脸图像,结合前面PCA模型得出投影系数公式为)(jmzT.前文取了200张人脸图像作为训练集。识别过程中计算j和人脸数据库里每个人脸的距离2j2||-||j.最后通过编写程序就能实现查找与待开始选取训练集样本构造特征脸空间将预存人脸投影到特征脸空间将待识别人脸投影到特征脸空间计算欧式距离返回最小距离的图像结束12识别人脸图像最相似的人脸图像。这里给出一次匹配成功的界面图片:图7基于欧式距离的人脸识别当给出原始图像后,在200个图像数据库里查找,由上图结果可知基于欧式距离的人脸识别结果模型给出了图像数据库里能够与原始待识别图像匹配度最高的图像。4.1.4基于支持向量机的人脸识别模型前文阐述了对人脸图像进行预处理的综合有效的方法,然后基于预处理后的图像用主成分分析法提取人脸特征信息,最后基于欧氏距离判据来对图像进行识别。这里的基于支持向量机的人脸识别结果模型也能够有效地对各张图像的投影系数进行分类,从而识别出待检测的人脸图像。传统的支持向量机是通过对两类数据的学习寻找一个最优分类13面,将两类数据无错误地分开的同时还要使两类的分类间隔最大。而这里的人脸识别的数据库的类别为多类问题,因此寻求有效的算法对传统支持向量机算法进行改进,使之能够对多类问题进行分类。本文设计的算法思想为:假定有k类样本,对任意两个不同的类构造一个最优分类面,每个分类器仅仅是在K类中的两类训练样本进行训练,所以总共需要构造2)1k(k个两类最小的向量机分类器。在构造第i类和第j类的支持向量机分类器时,分别选取第i类和j类的样本数据作为训练样本,属于第i类的样本记为正,属于第j类的样本记为负。借鉴冒泡排序的思想,对测试样本分别用2)1k(k个分类器进行分类。如果测试样本属于第i类,则在第i类的投票上加1,否则在j类的投票上加1.如此循环直到所有分类器分类完成,得票最高的类为测试
本文标题:基于人脸识别的数学建模优秀论文3
链接地址:https://www.777doc.com/doc-1340915 .html