您好,欢迎访问三七文档
图像处理学报,第7卷,第3期,1998年3月蛇、形状、梯度矢量流IEEE学生会员徐晨阳,IEEE高级会员JerryL.Prince摘要-蛇,或活动轮廓,被广泛用于计算机视觉和图像处理应用,特别是定位对象的边界。然而,初始化与深凹口收敛性差的问题,限制了它们的效用。本文为活动轮廓模型提出了一种新的外力,主要是为了解决这两个问题。这种外部力,我们称之为梯度矢量流(GVF),被计算成为一种灰度级或来自图像的边缘地图的二进制的梯度矢量的扩散。它从根本上不同于传统的蛇的外力,因为它不能被写成的势函数的负梯度,一致的蛇蛇应是直接从力平衡条件而不是从变分公式化制定的。通过使用几个二维(2-D)的例子和一个三维(3-D)的例子,我们表明GVF有一个很大的捕获范围,并能够使蛇进入深凹口。关键词-活动轮廓模型,可变形表面模型,边缘检测,梯度矢量流,图像分割,形状表示和恢复,蛇。I、简介蛇[1]或者说活动轮廓,是在一个在曲线本身弯曲所产生的内力和来自图像数据的外力的影响下可以移动的图像域内定义的曲线。这样定义的内力和外力,正符合在一个图像中的对象边界和其他所需的功能。蛇广泛应用于许多应用程序,包括边缘检测[1],形状建模[2],[3],分割[4],[5],和运动跟踪[4]、[6]。在现在的文献中,通常有两种类型的活动轮廓模型,即参数活动轮廓模型[1]几何活动轮廓模型[7]-[9]。在本文中,我们重点关注参数活动轮廓,尽管我们希望我们的研究结果也同样能应用在几何活动轮廓中。参数活动轮廓在图像域中可以合成参数曲线并允许他们拥有我们所期望的性质,通用的边。通常情况下,曲线被潜在力量的拉向边缘,这个潜在力量被势函数的负梯度所定义。额外的力,如压力,和潜在的力一起组成外力。当然也有设计好的内力保持曲线形状(弹性力)和防止曲线过度弯曲(弯曲力)。手稿于1996年11月1日收到,修订于1997年3月17日。这项工作由美国国家科学基金会的总统教职研究员奖MIP93-50336的支持。副主编负责协调本稿件的审查和批准工作,出版由GuillermoSapiro博士完成。作者与巴尔的摩的约翰霍普金斯大学的电气工程和计算机系下的图像分析和通讯实验室合作,MD21218USA(电子邮件:prince@jhu.edu)。出版商项目标识符s1057-7149(98)01745-X。参数活动轮廓面临两个关键问题。首先,轮廓必须初始化,通常情况下,最好接近真实的边界,否则容易收敛到错误的结果。为了解决这个问题,几个方案相继被提出,其中包括包括多分辨方法[11],压力法[10],和隐性距离法[12]。基本思路是,增加外力领域的捕获范围并引导轮廓朝着期望的边界贴近。第二个问题是,活动轮廓很难贴合边界的深凹部分。虽然压力法[10],控制点[13],域适应性[15],定向景点[14],[16]使用螺线管字段等方法相继被提出,但这个问题依然没有令人满意的解决办法。虽然大多数方法是为了解决这些问题而被提出,但这些方法在解决一个问题的同时又会造成一些新问题的出现。例如,多尺度方法可以解决捕捉范围的问题,但指定蛇应如何跨越不同的分辨率仍然是有问题。另一个例子是压力可以把活动轮廓强行贴合到边界的深凹处,但不能太强或“太弱”的边缘将会被淹没[17]。为推进或推出,压力也必须初始化,一个条件,要求小心初始化。在本文中,我们为活动轮廓模型提出一类新的外力以解决上述出现的两个问题。这些领域,我们称之为梯度矢量流(GVF)领域,密集的矢量场来自通过将变分框架中的能量函数减到最小得到的图像。最小化可能通过求解一对去耦线性偏微分方程得到,此方程是从图像中计算得到的灰度级或二进制边缘图像的扩散梯度向量。我们所说的活动轮廓是指使用GVF作为其外力的一个GVF蛇。GVF蛇区别于几乎所有以前有明确定义的蛇,其外力不能被写成一个势函数的负梯度。正因为如此,它可以不被配制使用标准能量最小化的框架;相反,它直接由力的平衡条件指定。与传统的蛇相比,GVF蛇的优势在于它对初始化不敏感并有能力移动到边界的深凹处。正如我们在本文中所表述的那样,其初始化可以在里面,外面,或在对象的边界。与压力不同,朝边界移动,GVF蛇不需要事先了解是否缩小或扩大。GVF蛇同样有一个大的捕获范围内,这意味着,除非受到其他对象的干扰,它可以在远离边界处被初始化。GVF增加捕捉范围是通过一个扩散过程,而这并不模糊边缘本身,所以多分辨率方法还是需要采纳的。CohenandCohen[12]的距离潜在力在本质上最接近GVF的外力模型。与GVF一样,这些力量来自于的地图图像的边缘,并且可以提供大的捕获的范围。然而,我们表明,与GVF不同,距离潜在力不能使蛇移动到深凹口。我们相信这是保守力的一个属性,已有的保守力描述几乎所有的蛇的外部力,探索非保守的外部力,如GVF,是活动轮廓模型未来研究的一个重要方向。我们可以注意到,本文所报道的部分工作引用参考下面的的参考文献[18]。II.背景A.参数蛇模型A代表传统的蛇,也就是一个曲线,]1,0[])(),([)(,ssysxsx,通过图像空间域的移动来减少能量函数的值。)1())(]'''[211022)()(dssEsxsxEext其中和分别是控制蛇的张力和刚性的带权参数,)('sx和)(''sx分别表示关于s的)(sx的第一和第二派生物。外部能量函数Eext来自图像,因此,我关注的特性需要较小的值,例如边界。给定一个灰度级图像),(yxI,作为一个连续位置变量),(yx的函数查看,典型的外部的能量设计来引导一个活动轮廓走向步骤边缘[1])3()2(]),(),([),(),(),(2)2(2)1(yxIyxGyxEyxIyxEextext其中),(yxG是标准方差的二维高斯函数,是梯度算子。如果图像是一个素描(黑白色),那么适当的外部能量包括[10]:)5()4(),(),(),(),(),()4()3(yxIyxGyxEyxIyxEextext从这些定义中容易看出更大的s'将会使边界变的模糊。然而这些更大的s'通常是需要的,因为它可以增加活动轮廓的捕获范围。能够最小化E的蛇A必须满足欧拉方程)6(0)()('''''Esxsxext这可以被视为一种力平衡方程)7(0)(intFFpext其中)()('''''intssxxF,EFextpext)(。外部潜在的力Fpext)(把蛇朝所需的图像边缘拉扯的同时内力Fint阻碍了其拉伸和弯曲。为了解决方程(6),通过把x当作t和..eis的函数,记作),(tsX,蛇可以被描述成动态的。然后关于t的x的局部派生物等于方程(6)的左手边,如下所示:)8(),(),(),(''''''EtsXtsXtsXextt当解决方案),(tsX稳定,项),(tsXt就消失了。通过离散化方程和解决离散系统迭代[参考文献(1)],我们可以找到方程(8)的一个数值求解方法。我们注意到大多数蛇的生长繁殖,依靠于要么是一个与Xt相乘的参数,以控制时间步长,要么是一个与Eext相乘的参数,它允许独立控制外力的强度。在本文中,我们让外部力量标准化,这样的最大量值等于1,并对所有的实验都使用一个单位时间的步长。B.传统蛇的行为传统的蛇的行为的一个例子可以参见图1中的1(a),1(a)中展示了顶部带有深凹口的U形对象(灰色表示部分)的6464像素的素描图像。它还显示了一个序列的曲线(黑色表示)用以描述传统的蛇(0.0,6.0)在对象之外初始化但在潜力场捕获范围之内初始化的迭代进展。潜力场EFextpext)4()(,其中0.1像素如图1(b)所示。我们注意到图1(a)中的最终方案解决了蛇配方的欧拉方程,但在穿过凹区域上但存在分歧。这种蛇收敛性差的原因是图1(c)中被揭示,所示的是深凹口内外力场的特写。虽然外力正确的指向对象的边界,但在深凹口内这个力却水平的指向相反的方向。因此,活动轮廓被拉扯除了U形上的每个“手指”,但并不会使得它被拉进凹口的内部。没有可以修正问题的和选择。传统蛇配方面临的另一个主要问题,即受限制的捕获范围的问题,可以通过图1(b)加以理解。在此图中,远离对象边界时,外力的幅度消失的极快。在等式(5)中添加的将会增加捕获范围,但边界定位将会变得不那么准确与不尽相同,并且当变得太大时凹口本身将会消除。CohenandCohen[12]提出了一种外力模型,这显著地增加了传统蛇的捕获范围。这些外力是潜能函数的负梯度,潜能函数是使用欧几里得(或倒角)距离映射计算得到。我们把这些力称作距离潜能力,以区别于在A章节里定义的传统的距离潜能力。图2显示的是使用了距离潜能力的效果。图2(a)显示的是U形对象(灰色表示)和一系列曲线(黑色表示)描述蛇从远离对象初始化到最终完成的过程。图1.(a)使用蛇时的收敛(b)传统潜能力(c)深凹口处的特写图2.(a)使用蛇时的收敛(b)距离潜能力(c)深凹处的特写在图2(b)中所示的距离潜能力和有关向量一起大幅度远离对象,这正好可以解释为什么这个外力模型的捕获范围会更大。如图2(a)所示,这个蛇也不能收敛到深凹口。这个问题可以通过对图2(c)中距离潜能力放大的部分的观查来解释。我们看到,与传统的蛇一样,同样水平地指向相反的方向,虽然可以把蛇分开但不能使蛇进入到深凹口。我们注意到Cohen和Cohen的对基本潜能力的修改,即把非线性转换应用于距离映射,这并不能改变力的方向,能改变的只有力的大小。因此,如何收敛到深凹的问题并不能被距离潜能力解决。C.广义力平衡方程图1(a)中蛇的解决方案对它们各自的能源模型都满足欧拉方程。因此,最终配置差的原因可以归结于对对象函数(1)局部最小值的收敛。一些研究人员通过来自力平衡方程的公式化的蛇寻求解决方案,在平衡方程中,Epext)(被更一般如下的外力Egext)(所代替:0)(intFFgext(9)Fgext)(的选择将会对蛇的实现和行为产生深远的影响。广泛来说,外力Fgext)(可以被分成两类:静态的和动态的。静态是指经过来自图像的数据计算之后得到的,并且不会随着蛇的移动而改变。标准蛇潜能力是静态的。动态力是指这些随着蛇变形而改变的力。为设法改进标准蛇潜能力,动态力的几种类型被发现。例如,用于多分辨率蛇的力和气球上的压力都是动态力。然而,多分辨率计划和压力的使用对它本身的性质增加了复杂性和不可预测性。例如,压力在推出或推进时必须初始化,并且如果它过大[17]时可能会淹没较弱的边界。相反,如果它朝着错误的方向推进或本身过小时,它可能不会移动到深凹内。在本文中,我们提出静态外力一个新的类型,一个不随时间改变和依赖于蛇本身位置的类型。来自亥姆霍兹定理(参考[19])的新的力的数学的基本前提,表明大多数静态向量场可以被分解成两个部分:一个无旋(卷曲)部分和螺线(发散)部分。外部潜能力从必须输入力平衡方程(6)作为静态无旋领域的传统的蛇的变分公式中产生,因为它是一个潜能函数的梯度。因此,一个更一般的静态领域Fgext)(可以通过允许存在由无旋和螺线两部分共同组成的领域的可能性获得。我们先前的文章[16]探讨了这个从图像中构建一个单独的螺线场的想法,随后再在其中添加一个标准的无旋场。在接下来的部分,我们将在设计有大的捕获范围和存在指向深凹的力的外力场中寻找一个更自然的方法。由此所得到的外力场,可以预料,将会包括无旋和螺线部分。III.梯度向量流snake整体来说,我们的方法是以力的平衡条件(7)为出发点来设计一条蛇。我们定义下面一个新的静态外力场领域),()(yxVFgext,我们把它叫作梯度矢量流(GVF)领域。为了获得相应的动态蛇的方程,我们用),(yxV更换在(8)式中的潜能力Eext,得到Vtststsxxxt),(),(),(''''''(10)我们把用参数曲线求解上述动态方程的结果称作一个GVF蛇。它可以通过离散和迭代进行数值求解,与传统蛇求解方式一样。尽管GVF蛇的
本文标题:Snakes--Shapes--and-Gradient-Vector-Flow翻译
链接地址:https://www.777doc.com/doc-5276776 .html