您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 股票报告 > SIFT、SURF、ORB
几种局部图像特征的提取算法的研究摘要:局部图像特征描述是计算机视觉的一个基本研究问题,在寻找图像中的对应点以及物体特征描述中有着重要的作用。本文主要研究了三种当前比较流行的具有不变性的局部图像特征提取算法,分析了SIFT、SURF和ORB特征点提取与定位方法,讨论这三种特征的特征描述子对特征点描述方法的异同。总结了三种特征描述方法各自的优缺点。关键字:局部图像特征;SIFT;SURF;ORBAnalysisofseveralfeature-extractalgorithmsAbstract:Localimagefeaturesisabasicissueofcomputervision.Itisimportantinthepratisetofindcorrespondingpointandtodescribethefeatureofobject.Inthepaper,westudythreepopularlocalimagefeatureswhichareimvariantdescriptors.WeanalysethewaytolocalizethekeypointoftheSIFT,SURFandORBalgorithm.Wealsodiscussthedifferentofthismethoedsonextractingthefeaturevectorofthekeypoint.Finally,wepointtheadvantageanddisadvantageofthismethoeds.Keyword:localimagefeature;SIFT;SURF;ORB一、概述局部图像特征描述的核心问题是不变性(鲁棒性)和可区分性。由于使用局部图像特征描述子的时候,通常是为了鲁棒地处理各种图像变换的情况。因此,在构建和设计特征描述子的时候,不变性问题就是首先需要考虑的问题。在宽基线匹配中,需要考虑特征描述子对于视角变化的不变性、对尺度变化的不变性、对旋转变化的不变性等;在形状识别和物体检索中,需要考虑特征描述子对形状的不变性。然而,特征描述子的可区分性的强弱往往和其不变性是矛盾的,也就是说,一个具有众多不变性的特征描述子,它区分局部图像内容的能力就稍弱;而如果一个非常容易区分不同局部图像内容的特征描述子,它的鲁棒性往往比较低。在众多的局部特征描述子中,SIFT、SURF和ORB特征是应用比较广泛,具有较好的鲁棒性和区分性的算法。这三种方法既有在描述特征点方面相通的地方,又有各自的不同,下面就对这三种方法进行详细的分析与比较。二、SIFT算法SIFT算法是Lowe与1999年[1]提出的一种局部特征提取的算法,并在2004年[2]加以完善和总结,成为目前一种具有很好稳定性和鲁棒性的特征提取算法。该算法有以下的优点:1)在适当的参数设置下提取到的特征点的数目可观;2)通过SIFT算法提取到的图像特征具有相当高的独特性,使其能在海量的数据库中进行准确的匹配;3)SIFT特征具有旋转、尺度、平移及亮度不变性,甚至对视点的变化也具有一定的不变性。SIFT算法对图像局部特征点的提取主要包括4个步骤:尺度空间极值点检测、特征点精确定位、特征点方向分配、特征点描述。1、尺度空间极值点检测建立图像的尺度空间是为了在每一个尺度上都有特征点,从而保证SIFT特征的尺度不变性,Koenderink[3]和Lindeberg[4]证明,高斯函数是唯一可以产生尺度空间的核。图像的尺度空间(,,)Lxy定义为原始图像(,)Ixy与一个尺度可变的2维高斯函数(,,)Gxy的卷积,如下式:(,,)(,,)(,)LxyGxyIxy(2.1)其中尺度可变高斯函数是:222()/221(,,)2xyGxye(2.2)(,)xy是空间坐标,是尺度坐标,的大小决定了图像的平滑程度,大尺度对应图像的概貌特征,小尺度对应了图像的细节特征。为了有效的在尺度空间检测到稳定的关键点,提出了高斯差分尺度空间,利用不同尺度的高斯差分核与图像的卷积生成。(,,)((,,)(,,))(,)(,,)(,,)DxyGxykGxyIxyLxykLxy(2.3)其中,k是表示相邻两尺度差异的常数因子。图像金字塔的建立:对于一幅图像I,建立其在不同尺度(scale)的图像,也成为子八度(octave),这是为了特征的尺度不变性,也就是在任何尺度都能够有对应的特征点,第一个子八度的scale为原图大小,后面每个octave为上一个octave降采样的结果,即原图的1/4(长宽分别减半),构成下一个子八度(高一层金字塔),如图1所示。将每一个塔中相邻的两幅图片相减就得到了高斯差分金字塔,如图1所示。如果中间的检测点和它同尺度的8个相邻点和上下尺度对应的18个点共26个点比较是极小值点或极大值点,就认为该点是图像在该尺度下的一个特征点。图1图22、特征点的精确定位由于高斯差分算子对噪声和边缘较敏感,为了提高SIFT特征点的稳定性,候选特征点被检测出来以后,还需要经过进一步的处理,以除去那些对比度低的极值点和边缘响应点。而且由于有高斯差分金字塔中检测到的特征点的坐标为整数,但是真正的特征点却不一定位于整数坐标上,因此必须对特征点进行精确的定位。高斯差分算子在图像的边缘处有较强的响应,但是边缘上的特征点定位不准确并且对噪声十分敏感,必须除去边缘响应点。DoG函数的峰值在横跨边缘的方向上有较大的主曲率,而在垂直边缘的方向上有较小的主曲率,因此可以利用这个性质去除边缘响应点。特征点的主曲率可以通过该点的处的Hessian矩阵来计算,Hessian矩阵定义如下:xxxyxyyyDDHDD(2.4)其中二阶导数可以通过相邻采样点之间的差分来估计。DoG函数的主曲率和H的特征值成正比,因此只有两个特征值都较大时的特征点才不是边缘点,才具有较强的稳定性。令α为较大特征值,β为较小的特征值,则可以得到海森矩阵的迹()TrH与行列式()DetH,()TrH(2.5)()DetH(2.6)令r,则22()(1)()TrHrDetHr(2.7)上式的值在两个特征值相等的时候最小,随着r的增大而增大,因此未检测主曲率是否在某阈值r下,只需验证下式22()(1)()TrHrDetHr(2.8)若该式成立,则对应的点为边缘点,在Lowe的文章中,取10r。去除不稳定的边缘相应点后,为提高特征点的图像匹配的稳定性和精度还要特征点进行精确定位。利用尺度空间函数(,,)Dxy的泰勒展开式来对DoG空间中的极值点进行精确定位。(,,)Dxy在特征点坐标处的泰勒展开式如下:221()2TTDDDXDXXXXX(2.9)其中D为(,,)Dxy在特征点位置处的值,(,,)TXxy是相对于此特征点的偏移量。通过对上式求导并令之为0,就可以得到()DX其最大值时特征点的坐标ˆX,212ˆDDXXX(2.10)当ˆX中的x或y方向上的偏移量大于0.5,则表明真正的特征点是偏向于其相邻的另外一点。此时,需要对此特征点的位置进行响应的调整,并再次计算ˆX,直到ˆX中的x或y方向上的偏移量小于0.5为止。3、特征点方向分配特征点方向分配的目的是使SIFT特征具有旋转不变性,它是利用关键点邻域内像素梯度直方图来为特征点指定一个主方向,然后根据此方向来生成特征向量,从而保证在图像旋转的情况下匹配的准确性。采用下面两个式子可以计算图像中一点的梯度的模值和方向:22(,)((1,)(1,))((,1)(,1))mxyLxyLxyLxyLxy(2.11)1(,1)(,1)(,)tan(1,)(1,)LxyLxyxyLxyLxy(2.12)其中L所用的尺度为每个特征点各自所在的尺度。以特征点为中心的邻域窗口内采样,并用直方图统计邻域像素的梯度方向。梯度直方图的范围是0~360度,其中每10度一个柱,总共36个柱。使用高斯函数对直方图进行平滑,减少突变的影响。直方图的峰值则代表了该关键点处邻域梯度的主方向,即作为该关键点的方向,其他的达到最大值80%的方向可作为辅助方向。4、特征描述特征描述是用一个特征向量来描述特征点的独特性,特征向量不仅包涵特征点本身的信息同时还包涵特征点的邻域信息,该向量是特征点匹配的依据,通过不同的特征向量提取方法可以使特征点具有不同的特性,如对于图像模糊、平移、旋转、仿射变换具有不变性等。如图3所示,SIFT算法通过将特征点的邻域旋转到特征点所在的方向后,对图像区域进行分块统计梯度直方图,然后利用8个图像块的梯度直方图,生成具有独特性和旋转不变性的特征向量。为了进一步提高SIFT特征点的稳定性,将特征向量进行归一化以消除线性光照变化对特征向量的影响。由于非线性光照变化,对像素点的梯度幅值影响大,对梯度方向影响小,因此考虑先对梯度的幅度进行限幅(如0.2),再对限幅后的特征向量进行归一化。经过修正后的特征向量对图像的光照变化具有相当高的不变性。图3三、SURF特征SURF特征是HerbertBay等人于2006年[5]提出来的全称为加速鲁棒特征(SpeededUpRobustFeatures),实质上是改进板是SIFT特征,它的主要特点是快速性,同时也具有尺度不变的特性,对光照变化和仿射、透视变化也具有较强的鲁棒性。SURF特征的提取过程有两步:1)基于Hessian矩阵和积分图像的兴趣点检测;2)SURF特征描述子的生成。1、基于Hessian矩阵的兴趣点检测SURF算法采用近似Hessian矩阵检测兴趣点,通过Hessian矩阵在三维尺度空间中的极值点来确定兴趣点由于Hessian矩阵要计算像素点与高斯二阶偏导数的卷积,而这个计算有相当的耗时,因此次啊用积分图像和盒滤波器来代替图像的卷积,以加快特征提取的速度。首先介绍积分图像,将原图像表示为(,)Ixy,像素点(,)xy对应的在积分图像中的值为(,)Ixy,则积分图像(,)Ixy是以原点和点(,)xy为对角线的矩形框内所有点的像素值之和,如下式所示:00(,)(,)jyixijIxyIij(3.1)图4在积分图像的基础上要想得到图像中一个矩形区域的内像素值的和便只要三次加减运算就可以得到了,如图4所示,矩形区域内的像素点之和ABCD。这在盒滤波器的的卷积运算中可以成倍的提高运算速度,这也是SURF特征比SIFT特征速度快的一个重要因素。SURF特征的尺度不变性体现在通过求取不同尺度的Hessian矩阵行列式的局部最大值得到尺度不变的特征点。图像在尺度下的Hassian矩阵为:(,)(,)(,)(,)(,)xxxyxyyyLXLXHXLXLX(3.2)其中,(,)xxLX表示高斯二阶偏导数22()gx与图像在像素点(,)xy出的卷积,表示在尺度下该点在x方向上的二阶偏导数,()g为高斯函数,可以用下式来表示:222()/221()2xyge(3.3)Hessian矩阵的行列式为:2det()(,)(,)(,)xyxxyyHLXLXLX(3.4)当Hessian矩阵的行列式为负是,表明该矩阵的两个特征值异号,则其不太可能是极值点,当行列式为正是,则Hessian矩阵的特征是同时正或同时负,该点有可能是局部极值点,因此可以用Hessian矩阵行列式计算并寻找三维尺度空间的极值点,从而找到特征点。在Hessian矩阵的计算中要用到高斯函数的二阶偏导数与图像的积分,这个计算比较费时,因此采用盒状滤波器来近似高斯函数的二阶偏导数,如图5左边两个是y方向上的二阶高斯偏导数模版和混合二阶高斯偏导数模版,右边两个是其对应的盒状滤波器,由于这种盒状滤波器的模版都是由简单的矩形组成,采用积分图像进行运算可以提高卷积的速度,减少运算时间,加快了SURF特征的提取速度。图5采用盒状滤波代替高斯核函数后,不需要对高斯滤波进行离散化,并
本文标题:SIFT、SURF、ORB
链接地址:https://www.777doc.com/doc-5231291 .html