您好,欢迎访问三七文档
本章指导:重点掌握图像匹配与识别技术的基本概念以及常用图像匹配与识别方法,如基于匹配的识别、统计模式识别、句法模式识别等,对模糊模式识别、人工神经网络识别和支持向量机识别等有初步了解。第9章图像匹配与识别9.1模式与模式识别9.2基于匹配的识别技术9.3统计模式识别9.4句法模式识别9.5模糊模式识别方法9.6人工神经网络识别法9.7统计学习理论和支持向量机识别方法9.8小结第9章图像匹配与识别9.1模式与模式识别9.1.1模式的概念模式识别(patternrecognition)作为一门学科有其系统的理论基础和技术方法。模式识别属于图像分析的范畴,它所得到的结果是一幅由明确意义的数值或符号构成的图像或图形文件,而不再是一幅具有随机分布性质的图像。模式识别的目的是对图像中的物体进行分类,或者可以说是找出图像中有哪些物体。模式就是存在于时间和空间中,可以区别它们是否相同或相似的可观察的事物。但模式所指的不是事物本身,而是从事物中获取的信息。因此模式往往表现为具有时间和空间分布的信息。9.1.2模式识别系统模式识别技术起源于人类自身对事物的认知分析过程,是依据一定的量度或观测基础把待识别模式划分到各自的模式类中取得过程。模式类是指模式所属的类别或同一类中模式的总体。模式识别实际上包含了以下两个步骤:(1)特征提取和选择(2)决策分类模式识别系统的基本构成信息获取数据预处理特征提取和选择分类器设计分类决策训练过程输出结果信息获取部分为了使计算机能够对各种现象进行分类识别,首先利用各种输入设备将要识别对象的信息输入计算机。通过测量、采样和量化,可以用矩阵或者向量来表示待识别对象的信息,这就是信息获取的过程。预处理部分预处理的目的就是去除噪声,加强有用的信息,并对输入测量仪器或其他因素所造成的退化现象进行复原。对于数字图像来说,预处理就是应用前面讲到的图像复原、增强和变换等技术对图像进行处理,提高图像的视觉效果,优化各种统计指标,为特征提取提供高质量的图像。特征提取和选择由于待识别对象的数据量可能是相当大的,为了有效的实现分类识别,就要对原始数据进行某种变换,得到最能反映分类本质的特征。这就是特征提取和选择的过程。决策分类分类决策就是利用特征空间中获得的信息,对计算机进行训练,从而制定判别标准,用某种方法把待识别对象归为某一类别的过程。9.1.3模式识别方法的分类统计模式识别方法基本思想是将提取的特征向量定义在一个特征空间中,不同类别的对象都对应于空间中的一点,在分类阶段,利用统计决策原理对特征空间进行划分,从而识别不同特征的对象。统计模式识别的主要方法有:判别函数法、K近邻分类法、非线性映射法、特征分析法以及主成分分析法等。模糊模式识别模糊识别的理论基础是模糊数学(fuzzymath)。它根据人辨识事物的思维逻辑,吸取人脑的识别特点,将计算机中常用的二值逻辑转向连续逻辑。模糊识别的结果是用被识别对象隶属于某一类别的程度,即隶属度来表示的。人工神经网络模式识别人工神经网络研究源于对生物神经系统的研究。它将若干个处理单元(即神经元)通过一定的互连模型连结成一个网络,这个网络通过一定的机制(如误差后向传播)可以模仿人的神经系统的动作过程,以达到识别分类的目的。句法结构模式识别着眼于对待识别对象的结构特征的描述。将一个识别对象看成是一个语言结构,例如一个句子是由单词和标点符号按照一定的语法规则生成的,同样,一幅图像是由点、线、面等基本元素按照一定的规则构成的。9.1.4模式识别的应用模式识别已经在天气预报、卫星航空图片解释、工业产品检测、字符识别、语音识别、指纹识别、医学图像分析等许多方面得到了成功的应用。具体来讲,模式识别在图像处理与分析中的应用可分为以下几个方面:(1)字符识别(2)生物特征识别(3)遥感应用(4)医学诊断9.2基于匹配的识别技术9.2.1全局模板匹配为了从图像中确定出是否存在某一目标,可把某目标从标准图像中预先分割出来作为全局描述的模板,然后在另一幅图像中搜索是否有这种模板目标。设全图像f(x,y)大小为M×N,若目标模板是J×K大小的w(x,y),常用相关度量R(x,y)来表示它们之间的相关性:式中,m=0,1,2…,M-1;n=0,1,2,…,N-1。进一步,规格化相关度:式中设样板所框出范围都是j,k从1到J,K计算,而(m,n)则为f(x,y)的MN小区中任一点,式中f1(x,y)是f(x,y)在(m,n)点框出JK大小的f(x,y)区,当m,n改变时,可搜索到一个R(m,n)最大值,即为样板配准或匹配的位置。若图像和目标样板用f和w1向量表示,则相关计算为:式中w1为w(j-m,k-n)形成的向量。NyMxJ(m,n)w(x,y)K在点(m,n)处的全局样本相关9.2.2模板向量匹配若用向量描述样板,则相关匹配可以用求向量差的方法求相关,如用相似度作为样板与图像某子区域的匹配量度。把图像被J×K框出部分用向量表示,样板也用向量表示,这时两个向量相似度可用两个向量的向量差为相似度的一种度量,差值D(m,n)D(m,n)是被搜索到的图像场f(j,k)和样板w(n,j)差。规定一个最小向量差的阈值T,若则说明在(m,n)位置上匹配,应该指出向量仅为J×K维。SSDA法(SequentSimiliarityDetectionA1gorithm):SSDA法用下式计算图像f(x,y)在点(u,v)的非相似度m(u,v)作为匹配尺度,式中(u,v)表示的不是模板中心坐标,而是它左上角坐标。模板的大小为m×n。nkmllkwvlukfvum11),()1,1(),(如果在(u,v)处图像中有和模板一致的图案时,则m(u,v)值很小,相反则较大。在模板和图像重叠部分完全不一致的场合下,如果在模板内的各像素与图像重合部分对应像素的灰度差的绝对值依次增加下去,其和就会急剧地增大。因此,在做加法的过程中,如灰度差的绝对值部分和超过某一阈值,就认为这位置上不存在和模板一致的图案,从而转移到下一个位置上计算m(u,v)。还有一种把在图像上的模板移动分为粗检索和细检索两个阶段进行的匹配方法。粗检索,它不是让模板每次移动一个像素,而是每隔若干个像素把模板和图像重叠,并计算匹配的尺度,从而求出对象物体大致存在的范围。细检索,在粗检索求出的范围内,让模板每隔一个像素移动一次,根据求出的匹配尺度确定对象物体所在的位置。9.2.3特征匹配若图像待识别部分和样板都用特征向量表示,则向量的维数大为减少。例如用不变矩描述时,则f(j,k)和w(j,k)特征向量只有7维,即:X和W向量差可用差向量的范数来表示:若图像中已分割出L个目标物,求其中是否有目标物W,则只需求出L个选出其中最小的一个Dj,即为与w相似的图像。最小距离分类器该分类器基于对模式的采样来估计各类模式的统计参数并且完全由各模式类的均值和方差确定。假定有w个类,并给出w个参考矢量(此处具体为均值量),在这里将每一个模式用均值矢量表示:jNwmmm,,21wjxNmjxjj,,2,11式中Nj的为模式类中的模式数目。对于的最小距离分类就是把输入的新模式x分为类,遵循的分类规则就是x与参考模型原型之间的距离,与哪一个最近就属于哪一类。jjmjjm可采用欧氏距离来确定两者之间的接近程度:欧氏距离的最小值代表了模式的最佳匹配,所以只要达到最小值,就将划为第类。对此,继续对上式进行推导:从而可得:于是,可以将求最小值的问题转化为求下式最大值的问题:在取得最大值时,将此时的x划归到第类。wjmxxDjj,,2,1)().(..)()()(jTjjTTjTjjmxmmxxxmxmxxDjjmmx21)(xDj)(xDjjTjjTjmmmxxD.21.)(')('xDjj9.3统计模式识别统计模式识别主要是根据模式统计特性,采用一系列自动处理技术对给定模式进行大量统计分析,抓取反映模式本质的特征而进行赋值和分类识别处理。统计识别认为图像可能包含有一个或若干个不同的物体,对于每一个物体都应当属于若干事先定义的模式类之一。统计模式识别的过程统计模式识别方法最终都要归结为分类的问题。如果从某个模式中共抽取N个模式符图像,可以分为m个模式类,那么就可以对N进行分类,进而决定出未知图像属于这m个模式类中的哪一种。对模式的分类主要建立在统计决策理论之上的,而决策理论方法又要用到决策函数。通常可以把识别模式当作是对一个n维模式矢量进行分类,即:其中为描述模式表达方式的第i个描述符。Tnxxxx21ix上式代表了一个n维模式矢量,对于给定的m个模式类ω1,ω2,ω3,…,ωm,识别过程就是要确定此n维模式矢量是否属于模式类ωi,以及模式矢量中的每一个可以划归到哪一个ωi模式类。该问题也可以转化为对决策函数的确定,如果模式属于模式类ωi,就有从另一个角度考虑:如果将未知模式代入所有的决策函数,得到第i个决策函数的计算结果最大,那么就可以将这个未知模式划归到第i个模式类。在对决策函数进行计算时,不排除出现的可能。对于这种情况,实际得到的是第i个模式类与第j个模式类的决策边界,对于决策边界上的未知模式,可以通过下式对其进行补充判断:可见,对模式的识别关键在于找到合适的判别函数。9.4句法模式识别所谓句法,是描述语法规则的一种法则。一个完整的句子一定是由主语+谓语或主语+谓语+宾语(或表语)的基本结构构成。一种特定的语言,—定类型的句子之间是有—定的结构顺序的。无规则的任意组合,必然达不到正确的思想交流。形容词、副词、冠词等可以与名词、动词构成“短语”,丰富句子要表达的思想内容。而这些短语的构成也是有特定规律的。句子的层状结构自然句法规则的思想可以移植到图像的模式识别中。尽管自然界的景物组合是千变万化的,但仔细分析可以看出:某一对象的结构,也存在一些不变的规则。一座房子由内屋顶和墙面构成。组成屋顶的几何图形,可以是三角形、四边形、圆形等,组成墙平面的几何图形也是由矩形、平行四边形(透视效果)等构成,至少每一个墙面应该有门,而窗的高度不低于门等等。进一步,还可以提出一些用来刻画构成一所房子的规则,如屋顶一定在墙面之上,且由墙面支撑。一所房子这些规则就像构成一个句子的句法规则一样,是不能改变的。如果将描述房子的规则(它构成—个房子的模式)存于计算机,而我们的任务是要在一张风景照片上去识别有无房子,那么就可按照片上所有景物的外形匹配是否符合房子的模式(房子构成规则)。符合房子模式的就输出为“有房子”,否则,输出“无房子”。句法模式识别是将一个复杂的模式分解成一系列更简单的模式(子模式),对子模式继续分解,最后分解成最简单的子模式(或称基元),借助于一种形式语言对模式的结构进行描述,从而识别图像。模式、子模式、基元类似于英文句子的短语、单词、字母,这种识别方法类似语言的句法结构分析。因此称为句法模式识别。句法模式识别系统框图9.5模糊模式识别方法常规的分类方法规定一个像素只能属于一个类别,也称为硬分类。但是在物体的交界处,由于成像过程和数字化过程中分辨率及其他因素的影响,图像中物体边缘处的一个像素可能包含了两个物体的信息。换句话而言,就是这个像素既可能属于类别i,也可能属于类别j,也就是常说的混合像素。模糊模式识别是模糊集理论在模式识别中的一种应用,它认为一个像素是可分的,即一个像素可以在某种程度上属于一个类别,而在另一种程度上属于另一个类别。这种程度通过模糊数学中的隶属函数来表示。具体而言,在进行模糊模式识别时,多根据相似系数和距离来确定各样本之间存在的关系。相似系数越接近于1,则说明样本越接近,距离越小,样本也就越接近,可以将这些比较接近的样本归为一类。对样本间距离的计算可以采用绝对值距离(式1)、欧氏距离(式2)和马氏距离(式3)等几种不同的定义方式:模糊模式识别方法对图像进行分类的关键是确定每一个类别的隶属函数。不同类型的图像,其隶属
本文标题:数字图像处理第9章
链接地址:https://www.777doc.com/doc-2387981 .html