您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > 生物视觉原理在图像处理中的应用
生物视觉原理在图像处理中的应用1、生物视觉原理概述生物视觉是个交叉性研究领域,涉及认知心理学、人工智能、计算机图像处理等学科,生物视觉的重要性无庸置疑,因此研究生物视觉系统受到相关科学界的相当关注。与计算机视觉有很大的差别的是,生物视觉系统硬件层次上使用神经网络来实现。但如果两者选用同样的计算理论框架理论层次,那本质上应没有太大区别,仅仅区别在于计算机视觉把该研究作为进一步深入探索和理解人脑视觉技能的手段。计算机视觉研究其主要对象是数据,是一个3D到2D,以及2D到3D的逆问题,而生物视觉的研究能够充分理解人脑视觉认知过程,这也促进了计算机视觉更深入的研究和发展。生物视觉系统是一个串行与并行相结合复杂的高级视觉信息处理过程,当前在更高层次上的机理研究尚未有突破性进展。目前搞清楚的仅仅是其中的极小一部分,两者处于“独立自主,各自为政”的阶段,因此必须深层次研究生物视觉系统的各自功能和实现原理,而计算机视觉系统的发展也在视觉领域寻找着新的思路和方法,在未来,依据生物视觉模式识别模型来寻找新的计算机视觉方法,那时计算机视觉系统的研究和生物视觉系统的研究将融合在一起。了解大脑的运作机理如同大海捞针,而随着生理学和解剖学的近两个世纪的发展,生物视觉系统的研究进入神经元细胞的层面,自Hubel和Wiesel于50年代末首次开展对视皮层细胞的研究,为生物视觉系统研究方面做出了开拓性的工作和重大贡献,在这基础上关于视网膜、视神经通道和视皮层的研究不断深入,并取得了大量的重要的研究成果。他们在60-70年代提出了视觉感受野的理论,感受野是支持视觉信息分层串行处理的最重要的生理学基础。之后Kuffler首次通过对猫的神经元细胞的研究,提出感受野在反应上的空间分布呈同心圆颇顽形式,通过这些研究成果,1985年,Daugman等提出使用Gabor函数模拟视皮层中简单细胞的感受野。Riesenhuber和Poggio在1999年第一次建立了完整的视觉处理HMAX模型,这是一个从生物学的角度上模拟的多层次模型,并在进行模式分类与识别研究中取得相当高的正确率,引起了计算机视觉和生物视觉界相当大的关注和更深层次的研究。神经稀疏编码机制是初期视觉感知所采用的基本视觉响应方式,表示了图像中的高阶统计性。稀疏编码即给定输入图像,寻找一组完备基,使得图像在1这些基下的表示系数具有“大量系数为零,少量不为零”的稀疏特性。近年来,关于稀疏编码的研究使得人们突破了已有的完备基的思想框架,踏入新的领域。而对于超完备基(基函数的维数大于输出神经元的个数)的研究,最早由Olshausen等人将超完备基引入到稀疏编码模型中。稀疏编码技术发展迅速,但尚处于发展阶段,其在理论和应用方面的研究还有待于进一步深化和完善,是最近的一个研究热点。2、在目标检测中的应用复杂动态背景下的目标检测和提取是图像处理领域中的一项关键技术,在机器人视觉,工业交通监视,视频压缩和遥感影像解译等众多领域具有重要的应用价值。自然界中,生物视觉系统卓越的目标检测和跟踪能力是现有计算机视觉技术无法比拟的。为此,研究生物视觉中的生物学机理,降低计算机视觉在目标检测和跟踪上的虚警概率,获得稳定、鲁棒的目标提取效果成为当前研究的热点。目前,目标检测和提取算法主要分为基于空域特征的目标检测算法、基于时域特征的目标检测算法和时空域特征相结合的目标检测算法三大类。基于空域特征的算法是通过单帧图像局部区域内目标的显著特征进行目标检测和提取。而仅依赖空域特征的目标检测算法通常无法克服复杂背景干扰,对于占地面积较小、空间对比度较低、容易被周围背景物体混淆的目标,单纯依靠空域特征无法获得理想的提取效果。另外生物视觉研究表明,相对于空域特征,生物视觉系统对时域特征光具有更高的敏感性。基于时域特征的目标检测算法是以目标和背景之间的运动差异为依据,通过背景建模、光流场分析以及目标轮廓跟踪等方法实现目标检测与提取。采用背景抑制、运动矢量差异以及目标轮廓提取等方法可以降低复杂背景对于目标检测的干扰,但是对于动态复杂背景,该类算法仍存在一定的局限性。时空域特征相结合的目标检测算法是为克服依靠单一目标特征无法获得稳定检测效果的问题而提出的,该类算法试图通过融合不同类特征在目标检测和提取上的优点,获得理想的提取效果。2005年Cheng等人将Itti模型提取的空域特征与动态时域特征相结合,较好的改善了由于光照变化和噪声等因素对检测结果的影响。2009年Liu等人以信息论为基础提出了联合时空域特征显著性的目标检测算法(S-T,spatial-temporal)。3、在特征提取中的应用近些年来基于生物视觉的计算模型受到了广泛的重视,很多研究者受此启发提2出了基于生物视觉的特征提取,图1为一种基于生物视觉特性的特征提取框架图,基于生物视觉的特征提取目前在很多方面取得了成功的应用。Bileschi等人基于对视皮层区域特征提取机制的研究,构造了适合计算机视觉应用的一系列特征提取算法和学习方式,将标准特征集用于目标检测、纹理识别以及上下文分析,最终构建了一个统一的场景理解系统。图2基于生物视觉特性的特征提取Hinton在提出深层信念网络模型后,进一步将其应用在视频序列处理等任务中,取得了很好的效果;Boureau等人也提出类似卷积网络的基于非监督学习的层级稀疏特征提取方法,并将其用于目标识别。Serre等人在HMAX前馈模型的基础上,构造模拟各个细胞层的计算单元,并通过从自然图像中学习视觉特征库,实现对目标的不变特征提取,在复杂场景下广义目标识别任务上取得了成功应用。鉴于Serre标准模型在计算机视觉领域的成功应用,很多研究者进一步对其改进,提取生物启发的特征并扩展到其它应用领域,如将模型中的层级单元扩展成了层,并通过将检测运动信息的时空特征检测器进行级联实现人体动作的识识别,基于该模型提取出了一组新的有效特征用于人脸识别,并在多个数据库上证实了此生物启发的特征明显优于一些表现较好的视觉特征(如局部二值描述,梯度方向直方图等);Huang基于生物启发提出优选层滤波器的方法和一个非线性操作子,然后用层特征来编码人脸上的年龄细节,成功的应用于年龄估计;Tao等人将C1特征和一些降维等算法相结合,对特征进行优选,在歩态识别和场景分类上取得了不错的效果。除了基于Poggio团队提出的腹部流前馈识别模型产生的诸多特征提取算法和应用外,还有很多研究者基于视皮层中其它的功能特性提出了一些生物启3发的特征模型。Saber等人根据生物注意力机制提出了一种生物启发的显著区域检测方法,该方法提取的显著区域分辨率高,且目标的轮廓突出;Mahadevan等人基于中央周边差的显著性机制提出了一个生物启发的判别目标跟踪器,其将目标跟踪问题建模成一系列目标背景分类问题,有效提升了系统的性能。Yang等人基于稀疏编码模型和线性空间金字塔匹配方法来提取保留物体空间结构的鲁棒特征,在图像分类任务中获得了很大的成功;Zhang等人所在的团队深入稀疏编码的研究,分别提出了基于稀疏编码的有效外观模型和在线学习稀疏表达方法,在视觉跟踪应用中效果明显。还有研究者基于视皮层中感知色彩的机制,提出了模拟颜色拮抗细胞的特征提取算法,联合颜色和形状信息的颜色描述子,并扩展了多个流行的视觉系统,实验证明其能更有效的利用颜色信息;Yang等人基于颜色拮抗机制提出了一个模拟从视网膜到初级视皮层颜色信息处理的前馈级联模型,将其用于复杂场景中的边界检测取得了优异的性能。此外,Beghdadi等人对应用在图像增强、分割、编码等方面的基于图像感知的方法进行了综述,详细分析了它们的贡献及缺点;Saleiro等人也对用于主动视觉的多个生物启发的模型进行综合,集中分析它们的系统结构和算法,并最终建立了一个统一的框架系统。综上所述,基于生物视觉的特征提取算法是当前计算机视觉领域的一大热点,其带来了诸多灵感和机遇,在很多方面取得了进展和应用,但仍存在着一些不足,例如对于模拟腹部流前馈级联结构的特征提取模型(模型、模型等),其存在模型复杂计算量大等问题;对于基于从自然图像中统计学习而得的线性基函数来提取局部不变特征的模型,其存在训练迭代复杂或超完备基信息冗余等问题;而对于人类颜色感知机制的研究,目前还比较少,已有模型存在模拟不够深入等问题;此外,对于视皮层内响应合并机制的研究,基于生物视觉的局部特征描述等,目前也研究比较少,而这些生物特性或机制在计算机视觉中具有重要的作用,有很大的研究价值;同时,很多已有特征模型在性能上、鲁棒性上和速度上也存在很大的挑战。总之,目前研究基于生物视觉的特征提取算法或模型仍存在着很大的空间,具有广阔的前景和应用价值。4、在目标识别中的应用预处理这几乎是所有计算机视觉算法的第一步,预处理是在不改变图像携带的重要本质信息的前提下,处理的目的是为方便之后的处理过程,使得每张图像如颜色分布、尺寸大小、整体明暗等特性尽可能表观一致。预处理涉及的主要包括图像像素值的变换、几何变换、局部预处理、归一化、平滑和图像复4原等方法。在预处理中引入先验信息,可以对图像粗处理减小数据量得到目标,然后在更高分辨率图像上检测该假设,反复迭代直至出现的知识被证实或被拒绝,但反馈就可能超出预处理,图像分割把图像中感兴趣的物体分割出来,可以将反馈信息放在分割之后。特征抽取和选择。特征抽取负责从图像中得到重要的信息,忽略不太重要的信息,交给下一层使用,这一步影响着识别效果还有效率,是目标识别中的关键问题。图像的特征提取方法可以这样分为三种,基本的特征提取方法、基于选择注意机制的特征提取方法以及基于生物视觉特性的标准模型特征集合提取方法。基本的特征提取方法是指基本的颜色、灰度、形状、纹理等基本特征,通过对特征的统计分析得到相关的提取特征,一般的方法包括直方图均衡化,纹理分析的方法较常用的是共生矩阵法和随机场模型,基于选择注意机制的特征是指具有视觉特征的,比如角点、边缘、显著点等,通过建立视觉模型来体现视觉的选择性和主动性等特点,典型的方法比如和显著点、多尺度翻角点、描述等方法而关于生物视觉特性的标准模型的特征抽取,因为是比较新的研究比较少,有许多值得探讨和研究的问题,这在后面生物视觉中会着重介绍。另外,基于空间关系特征的子空间方法也是特征抽取的有效的方法,主要包括主成分分析、独立分量分析、辨别成分分析等,因具有很好的整体性,在特征抽取的研究中成为研究热点。建模和分类。在计算机视觉领域,常用的分类器有以下三种神经网络、支持向量机和分类。建立在结构风险最小化原则和计算学习理论基础上,通过约束经验风险和置信区域来满足分类要求神经网络属于人工智能的连接主义,已有很多众所皆知的成熟方法。方法是一种集成机器学习方法,一开始通过初级预测出一个粗糙的、不太正确的方法,按照一定的规则调整权重,不断自组织学习最终得出一个复杂的、精确的分类器方法。目前,研究将它们结合起来达到更好的效果也是一个热点。利用提取的图像特征集训练我们选择的模型,建模是物体识别系统中最重要的问题,建模的目的是建立特征与特征之间的空间结构关系,以此我们已经建立了许多不少目标识别的模型。生成模型方法是偏数学的模型,包括隐马尔可夫链和条件随机场。视觉系统中将选择有用信息,拒绝无用的信息的这个行为叫做视觉注意机制。生物视觉的注意机制提高了效率,完成极为复杂的信息处理任务,由于视觉注意机制能够快速准确的选择感兴趣区域,高效地完成视觉搜索任务,通过计算机来模拟视觉注意机制一直是研究中的重点。可以将注意划分为两种类型,分为自下而上的数据驱动,从这方面着重视觉注意显著图的建立也可以是自上而下的任务驱动,从高层的知识表达来确定视觉的显著性上升。在自下而上的5数据驱动的研究方面,主要基于和提出的特征整合理论,这是目前视觉注意理论中最具影响力的。而和基于空间观点,以特征整合理论为基础提出的视觉注意的第一个计算模型,虽是理论上的,只对简单的人工图像进行仿真。和提出的适用于自然图像的,最具代表性的高斯金字塔模型。而自上而下的任务驱动模型的研究成功就较少,提出了一个用于隐式视觉注意的神经网络模型,该模型依
本文标题:生物视觉原理在图像处理中的应用
链接地址:https://www.777doc.com/doc-2201381 .html