您好,欢迎访问三七文档
计算机视觉调研报告-1-计算机视觉调研报告摘要:在信息时代高速发达的今天,计算机视觉作为计算机科学的一个分支,也在人们日常生活中也得到广泛的应用,给人们的生活带来许多的便利,促进了科学技术的发展,本文是主要介绍一下计算机视觉的发展、在工农业以及其他行业的应用,还简要介绍了该技术在今天所面临的一些问题。关键词:计算机视觉;发展;应用;面临的问题;1.概述计算机视觉就是一门研究如何使机器学会看的技术,简言之,就是使用视觉传感器或者计算机模拟人眼视觉的基本功能,即通过这种技术可以实现对外在世界实际场景的感知、采集、处理以及解释理解等功能。此类技术的研究初衷是采集、感知相关环境的图像,定位、辨识具体目标,确认相关目标的排列分布组合、结构特点和相关目标间的关系,从而能够对外在世界里的实际场景和目标做出有意义的识别和判断;而且在今天计算机视觉是人工智能领域最热门的研究课题之一,它和专家系统、自然语言理解已成为人工智能最活跃的三大领域。尽管它还是一门年轻的学科,还没有形成完整的理论体系,在很多方面它解决问题的方法还是一种技巧,但它是实现工业生产高度自动化、机器人智能化、自主车导航、目标跟踪,以及各种工业检测、医疗和军事应用的核心内容之一,也是实现第五代智能机的关键因素之一。所以对于计算机视觉的研究是非常有意义的,成熟的计算机视觉技术对人类的发展会有相当大的促进作用。2.计算机视觉的发展计算机视觉是在20世纪50年代从统计模式识别开始的,主要集中在二维图像分析和识别上。20世纪60年代MIT的Roberts通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述。Roberts的研究工作开创了以理解三维场景为目的的三维计算机视觉的研究。20世纪70年代中期麻省理工学院人工智能实验室正式开设“计算机视觉”课程,由国际著名学者B.K.P.Horn教授讲授。DavidMarr教授于1973年应邀在MIT·AI实验室领导一个以博士生为主体的研究小组,1977年提出了不同于积木世界”分析方法的计算视觉理论该理论,称为马尔(Marr)视觉理论,他认为视觉可分为三个阶段,第一阶段是早期视觉,其目的是抽取观察者计算机视觉调研报告-2-周围景物表面的物理特性,第二阶段是二维半简图或本征图象;是在以观察者为中心的坐标系中描述表面的各种特性,根据这些描述可以重建物体边界、按表而和体积分割景物,但在以观察者为中心的坐标系中只能得到可见表面的描述,得不到遮挡表面的描述,故称二维半简图;第三阶段是三维模ICU、视觉信息处理的最后一个层次,是用二维半简图中得到的表面信息建立适用于视觉识别的三维形状描述,这个描述应该与观察者的视角无关,也就是在以物体为中心的坐标系中,以各种符号关系和几何结构描述物体的三维结构和空间关系。该理论在20世纪80年代成为计算机视觉研究领域中的一个十分重要的理论框架。到20世纪80年代中期计算机视觉获得了蓬勃发展,新概念、新方法、新理论不断涌现比如,基于感知特证群的物体识别理论框架,主动视觉理论框架,视觉集成理论框架等。而且自80年代以来,计算机视觉的研究已经实验室走向实际应用的发展阶段。而计算机水平的飞速提高以及人工智能、并行处理和神经元网络等学科的发展,更促进了计算机视觉系统的实用化和涉足许多复杂视觉过程的研究。目前,计算机视觉技术正在广泛的应用于几何计算、计算机图形学、图像处理、机器人学等多个领域中。3.计算机视觉的应用在网络和信息时代非常发达的今天,计算机技术也在不断的发展与完善,使得它在人们的现实生活中扮演的角色也越来越多,而且该技术的应用的领域也越来越广,它所表现出来的价值也越来越高。下面就简单的分析该技术在各个方面的应用,在介绍它在各个方面的应用之前简要的引入一些计算机图像处理的方法,因为计算机视觉的处理技术主要依赖于图像的处理方法。3.1计算机视觉图像处理方法3.1.1图像变换图像变换是许多图像处理与分析技术的基础,为了有效快速地对图像进行处理和分析,常需要将原定义在图像空间的图像以某种形式转换到另一些空间,并利用在这些空间的特有性质方便地进行一定的加工,最后再转换回图像空间以得到所需的效果。计算机视觉调研报告-3-3.1.2图像增强图像增强目的是对图像进行加工,以得到对具体应用来说视觉效果更“好”更“有用”的图像,从根本上说并没有图像增强的通用标准,观察者是某种增强技术优劣的最终判断者,由于视觉检查和评价是相当主观的过程,所谓“好图像”的定义在比较增强算法性能中实际上是非常多变不定的。3.1.3图像恢复图像恢复也称图像还原,就是尽可能地减少或者去除数字图像在获取过程中的降质,恢复被退化图像的本来面貌,从而改善图像质量。3.1.4图像编码图像编码也称图像压缩,图像数据量是非常巨大,无论传输或存储需要对图像数据进行有效的压缩,压缩数据量的重要方法是肖除冗余数据,对图像进行存储、处理和传输等之前进行,而在这之后需要将压缩了的图像解压缩以重建原始图像或其近似图像。3.1.5图像边缘锐化图像边缘锐化处王里主要是加强图像中的轮廓边缘和细节,形成完整的物体边界,达到将物体从图像中分离出来或将表示同一物体表面的区域检测出来的目的。3.1.6图像分割图像分割是指把一幅图像分成不同的区域。这些区域要么对当前的任务有意义,要么有助于说明它们与实际物体或物体的某些部分之间的对应关系,一般来讲,分割出的区域需同时满足均匀均匀性和连通性的条件。3.1.7图像识别图像识别是利用计算机识别出图像中的目标分类,用机器智能代替人的智能,目前用于图像识别的方法主要分为决策理论和结构方法。图像经过处理后输出图像的质量得到相当程度的改善,既改善了图像的视觉效果,又便于计算机对图像进行分析、处理和识别。计算机视觉调研报告-4-3.2计算机视觉技术在工业领域的应用研究近年来,随着计算机集成制造系统的推广和应用,计算机视觉的应用已从国防工业转向民用工业,而且现在被广泛应用于电子、汽车、木材、纺织、包装和航空等工业领域之中,之所以能够得到广泛应用,是因为它易于同设计信息和加工控制信息集成,具有不与被检测表面接触、检测速度快、抗干扰能力强等优点;而且它可以保证产品质量,提高生产率,解放人力,降低生成成本。.3.2.1产品形位尺寸检查计算机视觉在制造业中通常是检查产品的尺寸是否在容许的范围内或产品是否有正确形状。这类检查方法主要涉及到被检产品二维或三维的几何特性,例如表面形状、位置、圆度等特征,也就是空间特征的检查。3.2.2产品表面质量检查通过计算机视觉对产品表面凹陷、划痕、裂纹以及磨损进行检查或对表面、粗糙度和纹理进行检测,从而对产品进行有效的评估或分级。3.2.3产品零部件缺失检测在生产线上,通过计算机视觉能准确地检查产品是否丢失零部件(螺钉、铆钉等)或检查产品是否混有外物、杂质。3.2.4零部件文字标记识别与检测文字识别技术在工业自动化生产中有许多成功的应用实例。序列号作为零部件的唯一身份标志,通常打印在电子元器件、集成电路板、大型工件成品的外表面上,由数字、字母和汉字等组成(以数字和字母居多)。这些字符标号或编码,如采用人工方式用眼睛对这些字符进行观察识别,将不能满足高效率生产自动化的要求。由于字符在工件上的位置很多时候都不便于人眼观察;人眼疲劳因素的作用也会使检测结果不能从根本上得到保证,有些情况下甚至不能进行正确识别。3.2.5视觉伺服系统计算机视觉技术应用于机器人领域,为机器人建立视觉系统,使得机器人能更灵活、更自主地适应所处的环境,以满足柔性生产中自动定位、装配、搬运和计算机视觉调研报告-5-自动焊接的需要。3.3计算机视觉技术在农业领域的应用研究计算机视觉技术在农业上的应用研究,起始于20世纪70年代末期,主要应用于植物种类的鉴别、农产品品质检测与分级等。随着计算机软硬件技术、图形图像处理技术的迅猛发展,它在农业上的应用研究有了较大的突破,在农业领域的生产前、生产中、收获时和产后的各个环节中,均可以利用计算机视觉技术来实现这些农业生产的视觉化。计算机视觉在产前的应用主要是检验种子质量;在产中的应用包括田间杂草识别、植物生长信息的监测、病虫害的监视和营养胁迫诊断等方面;在农作物收获时的应用主要体现在农业机器人的研制与开发上;在产后的应用包括水果分级和农产品的加工等。3.3.1在产前的应用计算机视觉技术在产前的应用主要是检验农作物种子质量,其检测方法有:净度图像分析、种子发芽图像分析、品种鉴定的图像分析和种子活力的漫射光测定。3.3.2在产中的应用杂草的识别是根据杂草的不同的种类可以采取光谱分析法、颜色分析法、纹理分析法或外形分析法,确定农产品中杂草密度和种类情况;利用计算机视觉技术对设施农业中动植物生长进行监测,不仅可以检测设施内植物的叶面积、茎杆直径、叶柄夹角等外部生长参数,还可以根据果实表面颜色判别其成熟度,以及作物缺水缺肥等情况;3.3.3在产后的应用通过图像获取设备获取农产品图像,对图像进行去噪、分割处理后,可以从获取的图像中得到丰富的参数和数据信息。针对图像特征参数与农业产品的外部物理参数(例如颜色、形状或大小等)不用人眼依次测定对象便可对其进行质量判别、筛选和分类,而且和人工检验相比具有效率高、识别率高、标准统一的优点,因此计算机视觉技术动植物和农产品等生物体的自动化检测筛选系统中得到广泛的使用。计算机视觉调研报告-6-3.4计算机视觉技术在其他领域的应用研究3.4.1计算机视觉技术在医学领域的应用研究X-CT、放射性同位素扫描、B型超声、核磁共振成像,是现代医学的四大成像技术。B超检测系统通过有规律的发射超声波,接受从人体发射回来的声音信号,形成灰度声图像线密度值。将计算机视觉技术应用于临床医学,可以准确的诊断出患者的状况,从而提高准确性,避免误诊等现象。3.4.2计算机视觉技术在公安工作中的应用指纹识别、人像识别是视觉技术应用在公安工作中所取得的突出成果。将现场收集到的指纹录入计算机,提取指纹特征后再和指纹库里的指纹进行比对,就可以提供破案的线索。指纹识别也可用于出入海关的身份检验及指纹密码锁等方面,指纹印鉴已用于银行业。计算机人像组合技术可以根据目击者的描述,由计算机用不同的人面像部件组合出嫌疑人的人面像协助破案。在公安刑侦中还应用了模糊图像复原技术对犯罪现场的模糊图像进行复原处理。4.对计算机视觉技术发展的认识与人体视觉系统相比,目前的计算机视觉系统无论从功能上来说还是从可靠性上来说都还很不健全,可以说仍处于很不成熟的阶段。原因是计算机视觉系统的研究过程面临着一系列技术上的难点:1.由于系统内部的和外界的各种干扰因素如噪声,物体表面的光学不均匀性,不理想的照明条件引起的阴影干扰,表面辉点及背干扰等,使得视觉系统中的图象处理阶段就很难得到满意的和可靠的结果,例如,至今尚无统一的方法来对付即使是并不复杂的但带有曲面的物体的图象,使得处理后能得到完整的轮廓线。真基元的丢失和假基元的增生有时是无法避免的。这就给后阶段的分析带来了很大的困难。当然,利用强的预知识作为指导,可以改善各阶段处理的效果,但是这样做就意味着牺牲系统的通用性;2.计算机视觉系统在分析和理解景物时,必须要在一幅或多幅平面图象中提取了维特征信息—深度信息或表面倾斜信息。这并不是一件简单的事情。应运而生一系列技术,如体视学,从运动图象重建物体的三维结构,从几个剪影恢复物体的三维信息等技术都是用来解决这一问题的。但是,上述这些技术都遇到了一个十分棘手的问题,就是如何在具有灰度失真,几何失真(包括透视、旋转、标计算机视觉调研报告-7-尺变换等失真)和干扰的情况下求取两幅和多幅图象之间的对应特征(对应问题有时称匹配问题或套准问题)。遗憾的是,至今尚无可靠的通用的求取对应特征的办法,尤其在图间失真和干扰比较严重的场合。利用照度学的信息可以从单幅图象得到深度信息,但是,必须对物体表面的光学特性作出严格的均匀性假定,对于照明条件也要作出严格的假定。这就同真实世界的情况相差很远。在景物分析中除了得到三维信息的困难外,在现实世界里
本文标题:计算机视觉调研报告
链接地址:https://www.777doc.com/doc-2045559 .html