您好,欢迎访问三七文档
当前位置:首页 > 财经/贸易 > 资产评估/会计 > 计算机视觉基础复习资料汇总
第一章PPTP11什么是计算机视觉1.采用计算机实现人类视觉的功能2.让计算机理解图像和视频P12计算机视觉与图像处理的区别图像处理侧重在“处理”图像:如增强,还原,去噪,分割,等等;而计算机视觉在于使用计算机(也许是可移动式的)来模拟人的视觉,因此模拟才是计算机视觉领域的最终目标。要实现这个目标,至少有两件事要做,第一是图像处理,第二是图像理解。比如一个机器人眼睛读入的数据可能是模糊的,可能是有噪声的,那么首先要进行去噪和还原。之后机器人要能理解这个图像意味着什么,比如特定的军事目标,那么它可能要进行分割,然后用统计学的方式进行模式识别。显然识别这个部分就属于图像理解,而非单纯的图像处理了。P14-20计算机视觉中存在哪些难点和挑战外观,大小形状,运动,复杂的姿态,外观变化,视点变化P23-28图像中存在哪些计算机视觉线索深度线索:直线透视,空间透视远近顺序线索:遮挡形状线索:纹理梯度形状和光照线索:阴影位置和光照线索:投影P30-46计算机视觉有哪些典型应用智能汽车,无人驾驶车人脸识别,表情识别,机器人P48CCD/CMOS传感器的成像原理:光电转换P49-54采样与量化影响图像的哪些属性采样:采样的频率量化:灰度级P61图像坐标系图像左上角为图像坐标系原点,即(0,0)点P75-78像素距离与邻域关系欧式距离:城区距离:棋盘距离:4邻域,对角邻域,8邻域习题第三章PPTP11薄透镜成像模型P17-21射影几何中哪些物理信息丢失和保留了?丢失:长度,角度保留:直线特性,交比不变性P22-24灭点和灭线的概念场景中的平行线投影到图像平面后,会聚于“灭点”场景中无尽远处的天与地连接成线,灭线。P46-49像机成像过程中包含了哪些内参和外参?像机内参fx:u轴尺度因子,或称u轴归一化焦距fy:v轴尺度因子,或称v轴归一化焦距γ:u轴和v轴的不垂直因子,通常为0u0,v0:光学中心像机外参R:像机旋转矩阵T:像机平移矩阵P51像机标定的目的,思路和基本方法目的:确定像机的内参和外参。思路:通过一组已知世界坐标的图像特征点,建立超定方程求解。方法:最小二乘求解超定方程,寻找最优估计。P63径向畸变和切向畸变的概念dr为极坐标的幅度变化量,表现为径向畸变。dt为极坐标的角度变化量,表现为切向畸变。习题第四章PPTP4-7图像平移、尺度、旋转和级联变换P14最近邻插值P16-18双线性插值第一步:水平方向线性插值第二步:垂直方向线性插值P20-31图像灰度映射P31-32直方图的概念和意义,用已学过的数学原理进行解释概念:图像中各灰度级出现频数分布的统计图表意义:反映各灰度级出现频数的分布情况,进而反映图像对比(清晰)度,但不反映各灰度级的空间位置分布P40直方图均衡计算书本p66例子,g=int[(L-1)*gf+0.5]L代表8表示灰度级P52-66模板滤波的概念和理解P69中值滤波概念和基本步骤选择局部窗口中亮度的中间值代替窗口中心像素步骤:将模板中心与图像中某像素位置重合读取模板下各对应像素的灰度值将这些灰度值从小到大排成一列找出这些灰度值里排在中间的一个将这个中间值赋给对应模板中心位置像素遍历图像中所有像素P71中值滤波与均值滤波的比较1、中值滤波可有效消除突变线性滤波总是响应所有的变化2、中值滤波具有部分不连续保持特性线性滤波会产生平滑过渡的效果习题第五章PPTP4为什么要边缘检测提取信息,识别目标恢复几何和视点边缘的成因曲面法线不连续深度不连续表面颜色不连续亮度不连续P10-21用已学过的数学原理解释边缘检测的原理P15有哪些一阶导数算子?试写出其模板形式P21有哪些一阶导数算子?二阶导数算子会对噪声敏感,试解释原因P28Canny算子的最优检测0.准则P41什么是角点?角点有什么特性?可重复性/可再现性同一角点应能在不同图像中检测出,不受几何和亮度等变化的影响显著性每个角点都是独特的局部性特征描述的是图像中的一个局部小区域P43SUSAN角点检测的基本原理P51Hough变换的基本思想(投票)以及为什么要进行Hough变换边缘点或特征点检测基于单个像素。边缘跟踪无法得到完整轮廓,存在弱边缘或边缘不连续。如何将离散的边缘点表示为更复杂的特征?P55Hough变换中参数空间的概念,试写出直线检测以及圆检测的参数空间设已知一黑白图像上画了一条直线,要求出这条直线所在的位置。我们知道,直线的方程可以用y=k*x+b来表示,其中k和b是参数,分别是斜率和截距。过某一点(x0,y0)的所有直线的参数都会满足方程y0=kx0+b。即点(x0,y0)确定了一族直线。方程y0=kx0+b在参数k--b平面上是一条直线,(你也可以是方程b=-x0*k+y0对应的直线)。这样,图像x--y平面上的一个前景像素点就对应到参数平面上的一条直线。我们举个例子说明解决前面那个问题的原理。设图像上的直线是y=x,我们先取上面的三个点:A(0,0),B(1,1),C(22)。可以求出,过A点的直线的参数要满足方程b=0,过B点的直线的参数要满足方程1=k+b,过C点的直线的参数要满足方程2=2k+b,这三个方程就对应着参数平面上的三条直线,而这三条直线会相交于一点(k=1,b=0)。同理,原图像上直线y=x上的其它点(如(3,3),(4,4)等)对应参数平面上的直线也会通过点(k=1,b=0)。P68Hough变换的优点对边缘不连续具有较好的容忍性对噪声干扰具有较好的鲁棒性对目标遮挡具有较好的抗干扰性习题第六章PPTP2目标分割的概念、目的、意义概念:将图像划分成若干具有特征一致性且互不重叠的图像区域的过程目的:有选择性地定位感兴趣对象在图像中的位置和范围意义:区域对于图像理解和识别非常重要,往往表征场景中的目标,或部分目标。一幅图像可以包含多个目标,每个目标包含多个区域,每个区域对应目标的不同部分。图像分割是将图像划分为一组有意义的区域。P14图像分割有哪些方法?基于哪些特征基于轮廓的确定目标轮廓基于区域的确定属于目标的像素。P27图搜索有哪些策略,以及各自特点广度优先搜索特点?深度优先搜索特点?启发式:启发函数,代价函数特点?与广度和深度优先搜索的联系?A算法和A*算法特点?P40试用直方图的概念解释直方图分割的思想P45最优阈值的分割思想阈值分割实质:灰度映射中的二值化方法,将图像像素分为两类:前景目标和背景思路:使图像中目标物和背景分割错误最小的阈值。P52最大类间方差(OTSU)的分割思想它是按图像的灰度特性,将图像分成背景和目标2部分。背景和目标之间的类间方差越大,说明构成图像的2部分的差别越大,当部分目标错分为背景或部分背景错分为目标都会导致2部分差别变小。因此,使类间方差最大的分割意味着错分概率最小习题第九章PPTP3-9图像中包含了哪些深度线索?阴影纹理遮挡运动模糊P26-27平行光轴立体视觉系统的感知深度的原理和基本公式三角形相似定理P32-3575-83立体视觉系统中有哪些约束极线约束立体匹配约束P41立体视觉标定校正的目的输入图像通过透视变换使得外极线水平,且共线。畸变校正,使得成像过程符合小孔成像模型。P52立体匹配的概念及分类立体匹配的过程:为左图像的每个像素点(xl,yl),在右图像中搜索对应点。局部立体匹配通常以基于局部窗口的立体匹配方法为主。匹配基元:局部窗口全局立体匹配匹配过程中,求解一行或整幅图像中所有像素的相似测度和最大/最小。匹配基元:像素致密匹配搜索每个像素的对应点,构建致密视差图匹配基元为像素稀疏匹配仅为特征搜索对应点,构建稀疏的视差图.匹配基元为特征。P58有哪些局部立体匹配方法??和优缺点优点:容易实现,只需要考虑局部窗口区域对纹理丰富的区域具有较好匹配性能速度快,只需考虑有限像素易于硬件实现,易于流水线实现缺点:视差不连续、遮挡或边缘区域无法正确估计视差对重复性纹理、无/弱纹理区域无法准确估计视差P84全局立体匹配的思想和优缺点
本文标题:计算机视觉基础复习资料汇总
链接地址:https://www.777doc.com/doc-2045552 .html