您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 商业计划书 > 智能信息处理课程设计
智能信息处理课程设计模式识别及其应用简介模式识别及其应用简介摘要:模式识别(PatternRecognition)又称图形识别,就是通过计算机用数学技术方法来研究模式的自动处理和判读。通常把环境与客体统称为“模式”。随着计算机技术的发展,人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是生命体对环境及客体的识别。模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。本文主要介绍了模式识别的基本原理、方法及各种技术,以及在相关领域的应用,并且通过车牌识别和两种人脸识别技术(PCA人脸识别和Face++人脸识别)来说明模式识别在现实生活中的应用,最后对模式识别领域的前景做出展望。关键词:模式识别;人工智能;车牌识别;PCA人脸识别;Face++人脸识别1模式识别的简介1.1模式识别模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(SupervisedClassification)和无监督的分类(UnsupervisedClassification)两种。二者的主要差别在于,各实验样本所属的类别是否预先已知。一般说来,有监督的分类往往需要提供大量已知类别的样本,但在实际问题中,这是存在一定困难的,因此研究无监督的分类就变得十分有必要了。此外,模式还可分成抽象的和具体的两种形式。前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。1.2统计模式识别统计模式识别的基本原理是:有相似性的样本在模式空间中互相接近,并形成“簇”。在连续情况下,假设对要识别的物理对象有d种特征观察量,这些特征的所有可能的取值范围构成了d维特征向量,(i=1,2,…,N),这些假设说明了要研究的问题有c个类别,各类别状态用来表示,i=1,2...,c;将一个给定的模式归入其中一个类别当中,然后根据模式之间的距离函数来判别分类。其中,T表示转置;N为样本点数;d为样本特征数。统计模式识别的主要方法有:判别函数法,k近邻分类法,非线性映射法特征分析法,主因子分析法等。在统计模式识别中,贝叶斯决策规则从理论上解决了最优分类器的设计问题,但其实施却必须首先解决更困难的概率密度估计问题。BP神经网络直接从观测数据(训练样本)学习,是更简便有效的方法,因而获得了广泛的应用,但它是一种启发式技术,缺乏指定工程实践的坚实理论基础。2模式识别的应用2.1文字识别文字识别是利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。文字识别一般包括文字信息的采集、信息的分析与处理、信息的分类判别等几个部分。文字识别方法基本上分为统计、逻辑判断和句法三大类。常用的方法有模板匹配法和几何特征抽取法。文字识别可应用于许多领域,如阅读、翻译、文献资料的检索、信件和包裹的分拣、稿件的编辑和校对等方面。2.2语音识别语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安验证方式。而且利用基因算法训练连续隐马尔柯夫模型的语音识别方法现已成为语音识别的主流技术,该方法在语音识别时识别速度较快,也有较高的识别率。2.3生物特征识别生物识别技术(BiometricIdentificationTechnology)是指利用人体生物特征进行身份认证的一种技术。更具体一点,生物特征识别技术就是通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性和行为特征来进行个人身份的鉴定。3模式识别在图像处理上的应用3.1车牌识别车牌识别技术(VehicleLicensePlateRecognition,VLPR):指能够检测到受监控路面的车辆并自动提取车辆牌照信息(含汉字字符、英文字母、阿拉伯数字及号牌颜色)进行处理的技术。车牌自动识别系统作为智能交通系统的核心部分之一,应用已经越来越普及。车牌识别系统主要分车牌定位~字符切分和字符识别三部分,而车牌定位又是系统中的关键技术。一种车牌定位算法的优劣,可以用定位准确率、实时性以及自适应能力来衡量。车牌区域的特点:1车牌底色往往与车身颜色、字符颜色有较大差异;2车牌的矩形区域内存在较丰富的边缘,呈现出规则的纹理特征;3车牌内字符之间的间隔比较均匀,字符和牌照底色在灰度上存在跳变;4图像中牌照长宽比的变化有一定范围。车牌定位中存在的问题:1含有丰富的自然背景及车身背景信息,同时易受照明、天气条件及运动失真和模糊的影响;2由于在野外环境下使用,车牌会有不同程度的磨损、污迹干扰、变形。这些问题给车牌定位带来了难度。国内外许多学者对车牌定位问题作了深入研究,收效颇丰。定位方法可分为基于黑白图像的车牌定位方法和基于彩色图像的车牌定位方法。车牌识别的过程:字符高度宽度和倾斜角检测检测算法如下:第一步:检测字符最高点和最低点。把车牌区的最左边界工和最右边界R的一水平线段等间隔分成M段(每一段约为一个字符宽.并视为一滑动条),各滑动条垂直向上一步一个像素滑动,计算每一滑动条穿过1像素的个数。当滑动条垂直向上移动到字符顶点并再向上移动一个像素时,滑动条穿过1像素的个数迅速下降到零,此时临界位置的像素即为滑动条内字符的最高点。同理,滑动条垂直向下移动可得到字符的最低点。第二步:确定精确的字符最高点、最低点、字符高度和倾斜角(由于噪声等影响,一些字符最低和最高点不一定是真实字符最高和最低点)。首先,建车牌识别过程打开图像图像二值化车牌定位字符分割字符识别立车牌的顶边和底边模型,顶边和底边分别用式(1)和式(2)表示;然后通过误差函数式(3)的最优解来确定底边和顶边的参数;最后,可得字符的高度估计值和倾斜度估计值。式(1)~(3)中的各变量和参数参见文献[2]。第三步:确定车牌字符区水平方向位置。先由字符高度计算出车牌字符区的宽度WZ,然后检测车牌字符区最左边界和最右边界,即在L位置向右几个像素范围内(略大于R—L-WZ个像素)和车牌字符高度方向的范围内进行多行扫描检测出最左的1像素,并标为最左边界位置L£,同理可检测出车牌区整个字符的最右边界位置LR。1212211211(,,)()1()1()Nyxyxiiiiiykxbykxbebbkukubvkvb第四步:将提取的字符与库里的字符进行模板匹配,将库中的模板和需要识别的图像中同样大小的其中一块区域进行比对。起先,需要识别的图像的左边顶角点和库中的模板的相同位置角进行重合,在这片重合在一起的区域中上下对比,接着向下一个像素位置进行评议比较,就这样对识别的图像上所有的区域都进行重叠比较,完成之后与库中模板相差最小的区域就是需要识别出来的物体,可以想象到用这个方法会对计算机的运算能力要求很高很高。3.2人脸识别起源及发展人脸识别的研究历史比较悠久,20世纪初就有学者在Nature杂志发表了两篇关于利用人脸进行身份识别的文章,当时还未涉及到人脸的自动识别。1990年以后,人脸识别技术才开始取得了长足的发展,到21世纪初,每年都有大量的学术论文发表,现在,几乎所有知名的理工科大学和IT产业的主要公司都有研究组在从事人脸识别的研究。同其他的特征同其他的生物特征识别技术,如指纹识别、说话人语音识别、虹膜识别、DNA识别、步态识别等相比,人脸识别具有被动、友好、方便的特点。人脸识别技术应用人脸识别技术在国家重要机关及社会安防领域具有广泛用途。例如:·嫌疑犯照片的识别匹配·信用卡、驾驶执照、护照与个人身份的识别·银行、商场安全系统·公众场合监控·门禁系统、计算机登录控制·基于目击线索的人脸重构·嫌疑犯电子照片簿·基于残留人脸的人脸重构·基于父母人脸的小孩脸推导生成3.21PCA人脸识别技术PCA人脸识别,即主成分分析法进行人脸识别。英文名为:PrincipalComponentAnalysis(主成分分析法),是一种得到广泛应用的事实上的标准人脸识别方法。传统主成分分析方法的基本原理是:先构造样本协方差矩阵,利用K-L变换抽取人脸的主要成分(特征值和特征向量),构成特征脸空间,将训练样本投影到此空间得到一组投影系数,识别时将测试图像投影到此空间,得到一组投影系数,将这些投影系数与训练样本的投影系数进行欧式距离度量,相当于与各个人脸图像比较,从而进行识别。PCA方法进行人脸识别的主要目的就是求出样本协方差矩阵的特征值和特征向量。PCA人脸识别操作过程简介:首先,将一副的图像表示成列向量。假设有200副训练的图像样本,将这200个图像样本写成一个图像样本矩阵为:样本矩阵的每一行代表一副训练图像。然后构造人脸图像训练样本的总体散布矩阵,即协方差矩阵为:即为K-L变换核矩阵,用来产生人脸样本的特征值和特征向量。为训练图像样本的平均图像。将核矩阵产生的特征向量构成样本人脸空间,即:为特征人脸,所有样本的特征脸构成特征人脸空间。有了人脸空间,进行以下K-L变换:得到样本人脸的投影系数矩阵Y,相当于得到样本在人脸空间里的坐标。12200X,,...,TxxxMNixTxx{[-][-]}XiiCExmxmxm12(,,...,)pwuuuiuY=Xw同样将单个测试图像进行同样的投影:得到测试图像的投影系数向量,即测试图像在人脸空间的坐标。识别时,将测试图像的投影系数向量与人脸空间的投影系数矩阵的每一行进行欧式距离度量,距离越小,则代表两张图像越相似。根据K最近邻(k-NearestNeighbor,KNN)分类算法可以将距离很小的两个图像划分为同一类。最后得出识别率。3.22Face++人脸识别技术Face++是新一代云端视觉服务平台,提供一整套世界领先的人脸检测,人脸识别,面部分析的视觉技术服务。Face++旨在提供简单易用,功能强大,平台通用的视觉服务,让广大的Web及移动开发者可以轻松使用最前沿的计算机视觉技术,从而搭建个性化的视觉应用。Face++同时提供云端RESTAPI以及本地API(涵盖Android,iOS,Linux,Windows,MacOS),并且提供定制化及企业级视觉服务。通过Face++,您可以轻松搭建您自己的云端身份认证,用户兴趣挖掘,移动体感交互,社交娱乐分享等多类型应用。4总结与展望模式识别从20世纪20年代发展至今,不存在对所有模式识别问题都适用的统一模型和解决识别问题的单一技术,需要根据具体问题把统计的和句法的识别结合起来,运用人工神经元网络、不确定推理、支持向量积、判别分析等方法进行研究求解。伴随着科技的发展,模式识别的研究与应用在工业、交通、文化、军事、能源等各个领域将会有更多的应用于发展,本文主要简单的介绍了一下车牌识别原理和技术、人脸识别技术(PCA人脸识别,Face++人脸识别技术),这两种模式识别的应用已经越来越广泛,并且技术也发展的越来越成熟。参考文献[1]H.KwakernaakandR.Sivan,DigitalImageProcessingUsingMATLAB,RafakeC.Gonzalez,RichardE.Woods,NJ;1991.[2]魏武,等,一种基于垂直字符边界特征的车牌定位方法[J].中国公路学报,2000,13(4):88—90.[3]边肇祺,张学工等.模式识别(第二版)[M].北京:清华大学出版社,2000.[4]RichardO.DudaPeterE.HartDavidG.Stork,PatternClassification,Second
本文标题:智能信息处理课程设计
链接地址:https://www.777doc.com/doc-5018399 .html