您好,欢迎访问三七文档
第9章计算机视觉简介•人类视觉•计算机视觉•Marr的视觉计算理论框架人类约有75%的信息是通过视觉系统获取的。视觉是思维的一种最基本的工具人类视觉人类视觉是通过人眼来感知世界的过程输入:通过眼睛对世界的观察输出:对世界的感知计算机视觉•计算机视觉是一门研究如何使机器“看”的科学,即用摄影机和电脑代替人眼对目标进行识别、跟踪和测量。•用计算机实现对视觉信息处理的全过程计算机视觉是通过对图像和视频的分析处理,实现类似人类视觉感知能力的过程输入:图像或视频输出:对象的恢复以及对对象信息的使用Marr的视觉计算理论框架DavidMarr(1945-1980)是英国心理学家。他将心理学、人工智能和神经生理学的结果结合起来,对视觉的研究做出了重要贡献。他是计算视觉的奠基人。DavidMarr70年代末在美国MIT提出了第一个较为完善的视觉系统框架此框架尽管存在很多缺陷,但过去20多年一直处于主导地位视觉系统研究的三个层次表1-1计算理论表示和算法硬件实现计算的目的是什么?如何实现这个计算理论?在物理上如何实现为什么这一计算是合适的?输入、输出的表示是什么?这些表示和算法?执行计算的策略是什么?表示与表示之间的变换是什么?视觉信息处理的三个阶段低层视觉(Low-levelvision)构成所谓的“要素图”(primarysketch),包含一些基本的图像特征(角点、边缘、线条、边界、色彩、纹理等)中层视觉(Intermediate-levelvision)构成对环境的2.5维描述,即部分的、不完整的三维信息描述(恢复场景可见部分的深度、法线方向、轮廓等,包含了深度信息,但不是真正的物体三维表示。)高层视觉(High-levelvision)从2.5维描述得到完整的三维描述(恢复、表示和识别三维物体)Marr框架的计算机视觉三阶段Marr模型的缺点:假定视觉系统是被动的,给什么图像就处理什么缺乏或者未足够重视高层知识的指导作用由局部信息到整体信息的单向过程,没有反馈
本文标题:计算机视觉总论
链接地址:https://www.777doc.com/doc-3358350 .html