您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 计算机视觉的任务及目前研究的现状
计算机视觉的任务及目前研究的现状(一点个人观点和感受)胡占义中国科学院自动化研究所模式识别国家重点实验室人类视觉的目的JJGibson理论1:适应外界环境2:控制自身的运动DMarr:重构可见表面的几何形状形状位置运动整体感知:不可计算可计算计算机视觉的任务中心任务就是对图象进行理解–对单幅图象的理解–对多幅图象的理解–对视频图象的理解21世纪,是对video图象进行理解的世纪理解什么?形状,位置、运动人类视觉计算机视觉认知和感知理论或模型只有可计算才能对计算机视觉研究有推动作用历史与现状计算机视觉20多年来的二大事件主动视觉,目的视觉Marr计算视觉理论(80年代)使计算机视觉成为一门独立科学摄象机自标定和分层重建(90年代)使计算机视觉走出了低谷Marr计算视觉理论Marr计算视觉理论有二个核心论点:1:人类视觉的主体是重构可见表面的几何形状;2:人类视觉的重构过程是可以通过计算的方式完成的。Random-dotstereogramsBelaJuleszin1960病理学证据Marr计算视觉理论三个层次计算理论表达与算法算法实现三个步骤Primitives2.5D3D算法的三个步骤图像Zero-crossingRawprimalsketchFullprimalsketch立体视觉运动分析轮廓分析光照分析D212表达3D物体识别物体种类形状位置的描述人类立体视觉模块尽管人们对Marr计算视觉理论提出了这样那样的质疑和批评,但Marr计算视觉仍然是计算机视觉的主流理论。也许Marr的“视觉主体为对可见表面的重构”假设是错误的,但人类的立体视觉通道是最主要的通道之一。人类视觉通道计算机视觉的发展历程1982198819932004工业应用,精度要求高精度要求不高的应用?92年以来最大的理论成果分层重构理论图象图象射影空间仿射空间欧氏空间欧氏空间认知心理学实验支持分层重构理论优先级别拓扑空间射影空间仿射空间欧氏空间PXU不同空间下重建的定义如果则XAPAU1当A为射影变换矩阵时,称此时的重建为射影重建当A为仿射变换矩阵时,称此时的重建为仿射重建当A为刚体变换矩阵时,称此时的重建为欧氏重建PEXEX,PUPE,XE欧氏空间欧氏变换欧氏重建射影变换射影重建仿射变换仿射重建计算机视觉的几个核心问题单幅图象分割问题多幅图象三维重构问题运动分割与跟踪与心理学、神经解剖学、生物物理学结合,解决计算机视觉的核心问题可计算性三维重构运动分析运动分割物体跟踪对应问题重构理论值得研究的主要方向当前的研究热点视觉监视运动问题重构问题最终目标Generalvisionsystem计算机视觉的主要机构,代表人物O.Faugeras,B.Triggs:INRIAA.Zisserman,OxfordU.L.VanGool,M.Poleffeys:LeuvenU.R.Hartley,AustraliaY.Ma,IllinoisU.分割不是一个well-posed问题我们能从图象中分割出一个红把手的白茶杯吗?基于内容的图象检索不是一个well-posed问题形状的相似性图象内容在射影空间如何度量形状的相似性?重构问题的三个主要步骤Correspondence,CameraCalibration,Motiondecomposition鲁棒性问题计算机视觉的根本问题是一个鲁棒性问题,如果不考虑鲁棒性问题的话,计算机视觉几乎所有问题都解决了R.Harallick前IEEETrans.PAMI主编,IAPR主席Questions!!!
本文标题:计算机视觉的任务及目前研究的现状
链接地址:https://www.777doc.com/doc-3380346 .html