您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第7章图象分割与区域提取
1第7章图象分割与区域提取图像分割就是将图像中不同性质的区域分开,将相同性质且相邻的像素分在同一区域,以便提取感兴趣的目标区域,识别图像的背景和主体,分析其颜色、纹理、形状、位置、大小等特征。如果把图像看成是像素的集合,则图像分割可用数学方法做如下定义:令集合R代表整个图像区域,对R的分割可看作将R分成若干个满足以下5个条件的非空的子集(子区域)R1,R2,…,Rn:(1)1niiRR;(2)对所有的i和j,ij,有ijRR;(3)对i=1,2,…,n,有P(Ri)=TRUE;(4)对ij,有FALSEijPRR;(5)对i=1,2,…,n,Ri是连通的区域。其中P(Ri)是对所有在集合Ri中元素的逻辑谓词,是空集。图像分割所依据的像素的性质可以是多方面的,如颜色(灰度)、纹理、位置、变换等方面的性质。在人们识别图像中的物体时,对图像的区域分割和物体的形状判断,综合利用了像素的各种性质、物体形状的先验知识和逻辑推理等,包括分析像素的颜色和邻域位置关系,检测与判断物体的边缘,利用形状模板对边缘轮廓连接,物体的结构、组成和空间关系等。人类复杂的心理活动计算机很难模拟,因此图像分割一直是图像处理、图像分析和计算机视觉等领域经典的研究难题之一。目前,图像分割的方法主要有三类:基于边缘的图像分割、基于像素聚类的图像分割和基于区域的图像分割。基于边缘的分割是利用对象与背景的明显边缘来提取对象的边缘轮廓,由闭合边缘线围成的区域就是对象的轮廓区域。基于边缘的分割方法有微分算子、边缘拟合、边界跟踪等,比较适合于分割边缘明显的图像,如卡通图、图形等。这类方法定位准确,但对噪声敏感,提取的边缘线常常不能闭合。基于像素聚类的分割是利用图像中像素的共性(如颜色、邻域内的纹理特性、分形维数等)进行聚类,形成具有形似性质的像素聚类区域。同一对象的像素应该聚类为同一区域,从而实现对象的区域分割。这类方法应该是图像区域分割的理想方法,但实现的困难在于如何选择像素的性质,有时难以对对象的像素性质进行抽象和描述。目前用于聚类的像素性质主要有像素的颜色、邻域内的纹理、分形维数等,像素聚类的方法主要有阈值法、K-均值法、ISODATA聚类法、基于模糊C-均值聚类的彩色图像分割等。基于区域的图像分割是对图像中性质上相似、空间上相连的像素聚合形成分离的区域,也是一种像素聚类过程。常用的方法有区域生长法、分裂合并法和松弛迭代法等。这类方法的难点也是在于确定像素聚类的规则和起始、终止条件,比较适用于颜色缓慢变化的大面积区域分割,如电脑生成的颜色渐变区域分割、自然界中的蓝天白云分割等。此外,还有基于模型的图像分割,如基于Snake模型的图像分割、基于组合优化模型的图像分割、基于目标模型的图像分割和基于Markov随机场的图像分割等。像分割是图象分析与识别的基础,是图像处理与计算机视觉等研究领域的经典难题之一。目前还没有一种完善的分割方法,对于广泛领域的图像可以按照人们的意愿准确地分割,而且分割结果的好坏或正确与否,也没有统一的评价标准,主要从主观感觉或实际应用的效2果来判断。7.1基于边缘的图象分割边缘是图像中颜色或灰度变化较大的像素点形成的边线,可能是物体或物体不同部位的边界,也可能是光照不连续造成的边线。物体或物体的不同部位的边界应该能够通过边缘检测找到,从而在图象中确定物体或物体的不同部位的边界。因此,边缘检测是图象中边界检测的直接而有效的方法。7.1.1边缘检测图像中的边沿可利用像素与领域的颜色或亮度差检测,如图7-1。灰度图象的边缘常用一阶和二阶导数检测,但导数对噪声太灵敏,因而发明了多种边缘检测算子,如Roberts算子、Prewitt算子、Sobel算子、Laplacian算子、Marr算子、Canny算子等,其摸板和效果如图7-2。(a)灰度图象中的边缘和一、二阶导数图象剖面一阶导数二阶导数线条型色差颜色突变型色差颜色(b)彩色图象中三种边沿的色差变化图7-1图像的边沿检测示例渐变型色差颜色3图7-2边沿检测算子及效果示例211121111111111-1-1-1-1-1-1-1-1-1-2-1-1--2Roberts算子Prewitt算子Sobel算子400008-1-1-1-1-1-1-1-1-1-1-1-1Laplace算子4彩色图象的颜色差可以用下式计算:(1)RGB颜色模式颜色差用颜色间的距离表示:Euclidean距离:d=sqrt((R1-R2)^2+(G1-G2)^2+(B1-B2)^2)^2;Manhattan(City-Block)距离:d=|R1-R2|+|G1-G2|+|B1-B2|;颜色差用颜色间的角度差表示:角度差:θ=acos((R1R2+G1G2+B1B2)/(sqrt(R1^2+G1^2+B1^2)*sqrt(R2^2+G2^2+B2^2))(2)HSI颜色模式颜色差用颜色间的距离表示:Euclidean距离:d=sqrt((I2-I1)2+S12+S22-2*S1*S2*cos(H2-H1))Manhattan(City-Block)距离:d=α*|I1-I2|+β*|S1-S2|+γ*|H1-H2|,其中α、β、γ是权重。边沿检测可以用下式计算:(1)梯度算子d=sqrt(dx2+dy2)/2dp1p2θISHdxddy5(2)邻域计算d=max(dx,dy,du,dd)7.1.2边缘二值化利用边缘检测算子得到的边缘图象是灰度图象,仍然需要将其转换为黑白边界图象,实际上是将灰度图象转换成二值图象,可以采用阈值法和极大值法,如图7-3。1986年Canny提出的最优阶梯型边沿检测算法(Canny算子)既完成边缘检测,有同时实现边缘二值化。绝对阈值法10相对阈值法100Vt1边缘灰度图7-3灰度边缘转换边界示例dxdddydu6彩色图像的边沿二值化示例如图7-4。7图7-4彩色图像的边沿二值化示例7.1.3边界跟踪和图搜索边界跟踪(boundarytracking)由一个边缘点出发,依次搜索并连接相邻边缘点从而逐步检测出边界。一般来说边界跟踪包括三个步骤:(1)确定作为搜索起点的边缘点;(2)确定和采取一种合适的数据结构和搜索机理,在已发现的边界点基础上确定新的边界点;(3)确定搜索终结的准则或终止条件,并在满足条件时停止进程,结束搜索。一个简单的情况如下。给定一幅只有一个目标的图象,先计算出其梯度图。从梯度图中选出梯度最大的点作为边界跟踪的第一个起点,然后在第一个起点的8-邻域中选梯度最大的点作为第二个边界点。设采用逆时针方向搜索,目标在边界跟踪方向的左方。以已经确定的两个边界点分别作为当前边界点C和前一个边界点P,每次在以当前边界点C为中心的33邻域中选取下一个边界点。根据点C和点P位置的不同,可得到如下图所示的八种组合。CPCPCPCPCPCPCPCP图搜索是借助动态规划过程寻求全局最优化的一种全局边界跟踪方法。具体是将边界点和边界段用图(graph)结构表示,通过在图中进行搜索对应最小代价的通道来寻找闭合边界。1个图可表示为G={N,A},其中N是1个有限非空的结点集,A是1个无序结点对的集。集A中的每个结点对(ni,nj)称为1段弧(niN,njN)。当弧是从结点ni指向nj时,那么称nj是父结点ni的子结点。有时父结点也叫祖先,子结点也叫后裔。确定1个结点的各个子结点的过程称为对该结点的展开或扩展。对任1段弧(ni,nj)都可定义1个代价(或费用),记为c(ni,nj)。如果有一系列结点n1,n2,…,nK,其中每个结点ni都是结点ni-1的子结点,则这个结点系列称为从n1到nK的1条通路(路径)。这条通路的总代价为:KiiinncC21),(原图边沿二值图灰度图边沿灰度图8我们定义边缘元素是2个互为4-近邻的象素间的边界。下左图给出图象中1个区域,其中括号内的数字代表各象素的亮度值。现设每个由象素p和q确定的边缘元素对应1个代价函数:)]()([),(qfpfHqpc其中H为图象中的最大亮度值,f(p)和f(q)为象素p和q的亮度值。根据这个代价函数,利用图搜索技术从上向下可检测出如下右图所示的对应大梯度的边界段。7.2基于像素聚类的图象分割7.2.1灰度图象阈值分割取阈值是最常见的并行的直接检测区域的分割方法。假设图象由具有单峰灰度分布的目标和背景组成,在目标或背景内部的相邻象素间的灰度值是高度相关的,但在目标和背景交界处两边的象素在灰度值上有很大的差别。如果1幅图象满足这些条件,它的灰度直方图基本上可看作是由分别对应目标和背景的2个单峰直方图混合而成。此时如果这2个分布大小(数量)接近且均值相距足够远,而且均方差也足够小,则直方图应是双峰的。对这类图象常可用取阈值方法来较好地分割。最简单的利用取阈值方法来分割灰度图象的步骤如下。首先对1幅灰度取值在gmin和gmax之间的图象确定一个灰度阈值T(gminTgmax),然后将图象中每个象素的灰度值与阈值T相比较,并将对应的象素根据比较结果(分割)划为2类:象素的灰度值大于阈值的为1类,象素的灰度值小于阈值的为另1类。这2类象素一般对应图象中的2类区域。取单阈值分割后的图象可定义为:)(0)(1),(Tx,yfTx,yfyxg≤如如例单阈值分割示例下图给出单阈值分割的1个示例。左图代表1幅含有多个不同灰度值区域的图象;中图代表它的直方图;右图代表分割的结果,大于阈值的象素以白色显示,小于阈值的象素以黑色显示。hzTz()01.极小值点阈值如果将直方图的包络看作1条曲线,则选取直方图的谷可借助求曲线极小值的方法。设用h(z)代表直方图,那么极小值点应满足:0)(0)(22zzhzzh和9和这些极小值点对应的灰度值就可用作分割阈值。2.最优阈值设1幅混有加性高斯噪声的图象的混合概率密度是:22222221211122112)(exp22)(exp2)()()(zPzPzpPzpPzp其中1和2分别是背景和目标区域的平均灰度值,1和2分别是关于均值的均方差,P1和P2分别是背景和目标区域灰度值的先验概率。参见下图,假设12,我们定义一个阈值T。这时错误地将一个目标象素划分为背景的概率和将1个背景象素错误地划分为目标的概率分别是:pT12zT(z())(z)p(z)pE1T()E207.2.2基于颜色聚类的图象分割基于像素聚类的图像分割是将图像的像素集合转换成像素的特征集合,形成像素特征空间,然后在像素特征空间中对像素聚类,将聚类后的像素映射回原图像,形成对原图像的自然分割。因此,基于像素聚类的图像分割过程包括:①选择用于聚类的像素特征,计算图像中每个像素的特征值;②根据像素特征值的分布和聚类规则,在像素特征空间中对像素聚类;③用聚类的标准特征值或聚类中心的特征值替代聚类中每个像素的特征值,或在图像中对像素的位置做出标记;④根据图像中每个像素新的特征值或做出的标记,实现对图像的分割。用于像素聚类的特征有很多,如像素的颜色、亮度、梯度,邻域内的纹理、分形维数、小波变换系数等。像素聚类的方法和规则也有很多,如阈值法、K-均值聚类法、ISODATA聚类法、模糊C-均值聚类法等。本文选择像素颜色作为聚类特征,利用极大值法对图像中的像素颜色聚类(同时提取图像主色调),用聚类颜色(对应图像主色调)替代图像中像素的颜色,实现基于颜色聚类的图像区域分割。图7-4示出颜色聚类后利用边缘分割图像的效果,其中(a)为原图像,(b)为颜色聚类图像。(b)图7-4颜色聚类的效果(a)107.2.3基于纹理的图象分割直观来说纹理描述可提供区域的平滑、稀疏、规则性等特性。利用Gabor小波变换实现纹理分割。7.3基于区域的图象分割串行区域分割中常利用图象多分辨率的表达结构,如金字塔结构。基于区域的串行分割技术有两种基本形式,一种是从单个象素出发,逐渐合并以形成所需的分割区域,称为区域生长。另一种是从全图出发,逐渐分裂切割至所需的分割区域。区域生长的
本文标题:第7章图象分割与区域提取
链接地址:https://www.777doc.com/doc-2111743 .html