您好,欢迎访问三七文档
摘要在人们获取的各类信息中,听觉信息占20%,视觉信息占60%,其他信息占20%。由此可见,图像信息在人们的信息生活中占据着重要的地位。如何更快,更好地获取自己所需要的图像信息,一直是我们亟待解决的一个重要课题。随着Internet的快速发展,越来越多的人期望从这些信息中获得自己需要的图像信息。然而,面对这么多的图像信息,如何获得自己需要的东西,并非简易的事,于是,基于内容的图像搜索技术应运而生。关键词:基于内容的图像检索;视觉特征;网上信息搜集;图像搜索的定义基于内容的图像检索根据图像、图像的内容语义以及上下文联系进行查找,以图像语义特征为线索从图像数据库中检出具有相似特性的其它图像。因为图像的规模一般要大于纯粹的文本信息,因此,基于内容的图像检索在检索的速度和效率上要求更高。通过基于内容的技术检索Web图像,首先需要从Web中剥离图像,组成图像集,对图像集中的各个对象进行基于内容的特征分析、相似度匹配。立足于图像内容,对图像进行分析和检索。相比而言,尽管图像检索已经出现了诸如直方图、颜色矩、颜色集等多种表征图像特征的方法,但是要突破对低层次特征的分析,实现更高语义上的检索,实现难度大,进展慢。不过,基于内容的图像检索建立在多媒体信息的内容语义上,能够更为客观地反映媒体本质的特征。基于内容的图像检索系统一般包括图像处理模块、查询模块、对象库和特征库和知识库图像搜索的发展自20世纪90年代初以来,基于内容的图像检索技术作为一门有别于基于关键词的图像检索的新兴信息检索技术,受到普遍关注,逐渐成为一个热门课题。该项检索技术由系统对图像进行特征描述、提取与识别,克服了传统的基于关键词检索中人工注解图像的主观性、不准确性和工作量大的缺陷。从早期对罪犯指纹的识别与管理、面貌特征的识别与管理「侧等专用系统的研究开始,经过相当长一段时间的发展,在理论上和技术上做了不少探索,产生了许多较成熟的基于图像特征的检索算法(如基于颜色特征检索的颜色累加直方图法和颜色集法、基于纹理特征检索的Tamura纹理法、灰度共生矩阵法和马尔可夫随机场模型法、基于形状特征检索的形状不变矩法和傅里叶形状描述符法等),并相应地开发出一些有价值的通用系统。譬如,国外较著名的有:美国RameshJain等人设计的,视觉信息管理系统VIMS(VisionInformationManagementSystem);IBMAlmaden研究中心开发的“基于内容检索系统QBIC;Virage公司开发的Virage,Excalibur技术公司开发的RetrievalWare,MIT媒体实验室开发的Photobook等。国内较有代表性的有:中国科学院计算技术研究所和北京图书馆联合开发的“基于特征的多媒体信息检索系统M工RESc8],清华大学开发的Internet上静态图像的基于内容检索的原型系统,浙江大学开发的PhotoNavigator,PhotoEngine等。图像搜索算法研究纹理可认为是灰度在空间以一定的形式变化而产生的图案,可用来对图像中的空间信息进行定量描述,是真实图像的固有特征之一。在MPEG.7中,图像的纹理描述符分为同质纹理、纹理浏览和边缘直方图。3.1同质纹理同质纹理对图像的用62个数值来表达,每个数值量化8bit。同质纹理包括强度均值、强度偏差、能量值、能量偏差等特征,抽取过程如下图所示。图一(1)采用Radon变换和·维Fourier变换,将图像转换到频率域。(a)Radon变换。Radon变换是一种直线积分的投影变换,某个角度口的沿着直线L(R,口)的线积分如下:式中占是从Y轴沿逆时针计算,尺是直线与原点的距离,舡∽是图像函数。万(·)是delta函数,只在t=0点有”冲激”,即=1;在其它各处,函数值为零。delta函数具有广f(x)d(x一口)出=厂(口)的性质。po(R)是投影,它将一个2D图像分解为每个角度的lD投影。(b)Fourier变换。不同方向的纹理具有不同的傅立叶频谱特征,所以可在图像的傅叶立域考察图像纹理的特性。投影Po(R)的一维Fourier变换为:(2)Gabor滤波。人的视觉系统对图像的观察是非均匀和非线性的,对频率的感知符合对数特性,在这一点上Gabor变换最符合人类的视觉机理。Gabor变换可将图像分解为一系列频道,提供纹理的多尺度、多方向性特征。MPEG.7同质纹理描述符把图像的频率空间在角度方向上按30度角等分,即,其中r是角度索引,在径向上用以二分之一等比划分(分5个等级),划分的频率区域称为特征频道(G),共有30个特征频道。在径向上,特征频道的中心频率为,s∈{0,1,2,3,4),其中s是径向索引,COO是最高中心频率3/4。特征频道的频道径向宽度为,s∈{O,l,2,3,4},其中且是最大带宽l,2。每个特征频道从最外边开始,从右到左、从高频率到低频率的顺序编号,特征频道表示为(G),索引卢。对频率分布进行多尺度多方向划分后,二维Gabor变换叠勺函数为:(3)计算强度均值、强度偏差、能量和能量偏差。(a)强度均值和强度偏差。强度均值表示图像像素强度的均值,强度偏差是图像像素强度的偏差。强度均值表示图像像素强度的均值,强度偏差是图像像素强度的偏差。(b)能量和能量偏差。根据频率分布和Gabor函数,第f特征频道的能量e。定义为:。能量是一个1维数组,用Energy表示,长度为30,即Energy[O],...,Energy[29]。采用【4】的方法将每个特征频道的值统一量化成8bit。3.2边缘直方图入眼对对象的边缘比较敏感,所以基于边缘来计算特征比较符合人的视觉特性。边缘直方图描述符描述局部图像区域中边缘的五种空间分布:垂直边缘、水平边缘、450边缘、1350边缘、无方向江苏省系统工程学会第十届学术年会边缘。抽取过程和5种边缘如下:(a)垂直方向边缘算子(b)水平方向边缘算子(c)450方向边缘算子(d)135。方向边缘算子(e)无方向边缘算子图2五种边缘及算子(1)将原始图像分成4x4的不重叠子图,每个子图继续划分成若干个相同大小的图像块。(2)将每个图像块分割成2x2=4个像素块,将每个像素块视为一个像素,采用每像素块中所有像素的平均值表示一个像素块。(3)对每个2x2的图像块分别用五个边缘算子检测,获得边缘检测结果。(4)统计每个子图中图像块的边缘类型,获缛每个子图的5种边缘的直方图,并量化成3比特。结语基于内容的图像搜索系统的构建能够增加信息搜索的手段,使指挥员能够准确、快速地感知所需的信息,充分利用已有的信息源,提升指挥决策的效率。
本文标题:基于内容的图像搜索
链接地址:https://www.777doc.com/doc-2573571 .html