您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 数据通信与网络 > 第二章-数字图像处理基本概念
第二章数字图像处理的基本概念图像数字化图像数字化是将一幅画面转化成计算机能处理的形式——数字图像的过程。模拟图像数字图像正方形点阵具体来说,就是把一幅图画分割成如图2.3.1所示的一个个小区域(像元或像素),并将各小区域灰度用整数来表示,形成一幅数字图像。它包括采样和量化两个过程。小区域的位置和灰度就是像素的属性。将空间上连续的图像变换成离散点的操作称为采样。采样间隔和采样孔径的大小是两个很重要的参数。当对图像进行实际的抽样时,怎样选择各抽样点的间隔是个非常重要的问题。关于这一点,图像包含何种程度的细微的浓淡变化,取决于希望忠实反映图像的程度。采样经采样图像被分割成空间上离散的像素,但其灰度是连续的,还不能用计算机进行处理。将像素灰度转换成离散的整数值的过程叫量化。一幅数字图像中不同灰度值的个数称为灰度级数,用G表示。一般来说,,g就是表示图像像素灰度值所需的比特位数。gG2一幅大小为M×N、灰度级数为G的图像所需的存储空间,即图像的数据量,大小为M×N×g(bit)量化数字图像的描述(1)1.黑白图像是指图像的每个像素只能是黑或者白,没有中间的过渡,故又称为2值图像。2值图像的像素值为0、1。011100001I数字图像的描述(2)2.灰度图像灰度图像是指每个像素的信息由一个量化的灰度级来描述的图像,没有彩色信息。100220250180501202001500I灰度图像描述示例数字图像的描述(3)数字图像的描述(4)3.彩色图像彩色图像是指每个像素的信息由RGB三原色构成的图像,其中RBG是由不同的灰度级来描述的。00255800255240240255R02550160255255801600G25525525524000160800B数字图像的描述(5)数字化方式可分为均匀采样、量化和非均匀采样、量化。所谓“均匀”,指的是采样、量化为等间隔。图像数字化一般采用均匀采样和均匀量化方式。非均匀采样是根据图象细节的丰富程度改变采样间距。细节丰富的地方,采样间距小,否则间距大。非均匀量化是对像素出现频度少的间隔大,而频度大的间隔小。采用非均匀采样与量化,会使问题复杂化,因此很少采用。量化参数与数字化图像间的关系一般来说,采样间隔越大,所得图像像素数越少,空间分辨率低,质量差,严重时出现像素呈块状的国际棋盘效应;采样间隔越小,所得图像像素数越多,空间分辨率高,图像质量好,但数据量大。量化等级越多,所得图像层次越丰富,灰度分辨率高,图像质量好,但数据量大;量化等级越少,图像层次欠丰富,灰度分辨率低,会出现假轮廓现象,图像质量变差,但数据量小。但在极少数情况下对固定图像大小时,减少灰度级能改善质量,产生这种情况的最可能原因是减少灰度级一般会增加图像的对比度。例如对细节比较丰富的图像数字化。数字化设备必须能够将图像划分为若干像素并分别给它们地址,能够度量每一像素的灰度并量化为整数,能够将这些整数写入存储设备。数字化设备A.采样孔:保证单独观测特定的像素而不受其它部分的影响。B.图像扫描机构:使采样孔按预先确定的方式在图像上移动。C.光传感器:通过采样孔测量图像的每一个像素的亮度。D.量化器:将传感器输出的连续量转化为整数值。E.输出存储体:将像素灰度值存储起来。它可以是固态存储器,或磁盘等。常用的数字化器是扫描仪和数码相机。数字化设备组成人类视觉的研究,一直是许多学者所关注的课题。这不仅因为视觉是人的主要感觉功能而需要充分地了解,人的视觉系统能那样完美的完成许许多多复杂的信息处理功能,故而引起许多学科的研究者对它抱有极大的兴趣,想了解视觉系统如何获得外界丰富的信息,如何进行压缩编码,又如何在大脑里表示这些信息,并最后作出决策和行动。总之人们想了解视觉系统作为一个信息处理系统是如何工作的。这是一些非常复杂的问题。视觉系统视觉研究所涉及的学科非常多,它与物理学、心理学、生理学、解剖学、计算机科学等有关。视觉系统基本构造(1)眼球结构平均直径:20mm虹膜:2mm~8mm控制入光量视网膜:图像视觉视锥体:中央凹颜色和细节识别600万~700万视杆体:亮度7500万~15000万白昼视觉和夜视觉视网膜结构模型视觉系统基本构造(2)视觉系统基本构造(3)眼睛观察树的光学表示方法晶状体的聚焦中心与视网膜(14mm-17mm)由睫状体的韧带张力控制晶状体的扁厚•图像变换图像变换目的在于:处理问题简化、有利于特征提取、加强对图像信息的理解。图像变换算法很多,重点学习傅立叶变换的算法、性质和应用。视觉系统基本构造(4)眼睛中图像的形成,外界光线通过透明的角膜射进眼球。角膜对入射光具有聚光作用,瞳孔起了照相机的光圈作用,它限制了入射光的通量。在虹膜的后面是晶状体,晶状体悬挂在睫状体上,睫状体的收紧和松弛使晶状体改变凸度,起着光学变焦透镜的作用。晶状体的后面是玻璃体,它充满在晶状体和视网膜所包围的内部空间,光线最后落在眼底的视网膜上。•图像变换图像变换目的在于:处理问题简化、有利于特征提取、加强对图像信息的理解。图像变换算法很多,重点学习傅立叶变换的算法、性质和应用。视觉现象眼见为实•图像变换图像变换目的在于:处理问题简化、有利于特征提取、加强对图像信息的理解。图像变换算法很多,重点学习傅立叶变换的算法、性质和应用。现象:明亮较暗现象?逐渐能够看清物体暗光适应(20~30s)较暗明亮现象?:逐渐能够看清物体亮光适应(1~2s)1亮度适应能力(1)•图像变换图像变换目的在于:处理问题简化、有利于特征提取、加强对图像信息的理解。图像变换算法很多,重点学习傅立叶变换的算法、性质和应用。1亮度适应能力(2)昏暗视觉和白昼视觉:人能适应亮度的范围是很宽的,从暗视阈值到强闪光之间的光强度差别约为1010级。人的眼睛并不能同时适应这样宽的光强范围。下图中说明了在交点以上,主观感觉亮度是更亮,而在交点以下,主观感觉是更暗,•图像变换图像变换目的在于:处理问题简化、有利于特征提取、加强对图像信息的理解。图像变换算法很多,重点学习傅立叶变换的算法、性质和应用。1亮度适应能力(3)实验证据表明主观亮度是进入眼内的光强度的对数函数•图像变换图像变换目的在于:处理问题简化、有利于特征提取、加强对图像信息的理解。图像变换算法很多,重点学习傅立叶变换的算法、性质和应用。2同时对比度(1)亮度对比背景亮度不同,人眼所感受的主观亮度值也不一样。—亮背景下显得暗、暗背景下显得亮。这种效应就叫同时对比度。同时对比效应随着背景面积增大而显著2同时对比度(2)相对应的还有“色度对比”物体背景视觉2同时对比度(3)人眼对亮度光强变化的响应是非线性的,通常把人眼主观上刚刚可辨别亮度差别所需的最小光强差值称为亮度的可见度阈值。也就是说,当光强I增大时,在一定幅度内感觉不出,必须变化到一定值I+ΔI时,人眼才能感觉到亮度有变化,ΔI/I一般也称为对比灵敏度。3对比灵敏度(1)•图像变换图像变换目的在于:处理问题简化、有利于特征提取、加强对图像信息的理解。图像变换算法很多,重点学习傅立叶变换的算法、性质和应用。无环境照度眼睛的对比灵敏度可以由实验测得。在均匀照度背景I上设有一照度为I+I的光斑,眼睛刚能分辨出的照度差是I的函数,当背景照度I增大时,能够分辨出的光斑I也需要增大,在相当宽的强度范围内I/I的数值为一常数,约等于0.02。这个比值称为韦伯比。但是在亮度很强或很弱时,这个数值就不再保持为常数。3对比灵敏度(2)有环境照度眼睛的对比灵敏度还与周围环境有关。设有两个相邻的光斑,一个强度为I,另一强度为I+I,周围环境的照明强度为I0,实验测得,I/I比值为常数的范围要大大减小,而且是环境照明强度I0的函数。更有趣的是图中曲线谷点的包络线与无环境照度曲线相同。3对比灵敏度(3)韦伯比:0.023对比灵敏度(4)4Mach带(1)人们在观察一条有均匀黑的区域和均匀白的区域形成的边界时,人们感觉到的是在亮度变化部位附近的暗区和亮区中分别存在一条更黑和更亮的条带,这就是所谓的“Mach带”,马赫效应。Mach在1865年观察并讨论了这种现象。输入图像是阶梯边缘模式,并且每级阶跃的灰度差相同、在同级条带内灰度均匀的情形下,人们在观察时却感到每个条带内灰度是不均匀的,每级阶梯的右边比左边更暗,这是因为对阶跃边界处主观的反差显著地增强了。4Mach带(2)主观轮廓,这是主观上感知的轮廓,实际上这个边界并不存在5主观轮廓古代希腊艺术家意识到空间错觉,在建筑设计中引入补偿校正技术以保持对物体及感觉的对称性。对于错觉产生的解释尽管很多,但看来只有对大脑功能进一步的认识后,才能得到满意的解释。6空间错觉视觉:主要研究光的物理本质、光刺激视觉感器官的程度、光经过视网膜后经视觉系统加工而产生的亮度与颜色的感觉视知觉:研究人是如何通过视觉形成关于外在世界的空间表象的。知觉将视野中的一些分散刺激加以组织,构成了具有一定形状的整体是在人脑中枢进行的一组整合活动7视觉和视知觉8立体视觉和运动视觉立体视觉:关键问题是对应点问题correspondenceproblem,也就是寻找匹配的问题matching。运动视觉:研究序列图像间的对应问题,主要问题是匹配。对于瞬时间的图像,即间隔时间很短图像序列,可以通过求解光流方程的方法寻找对应,其前提假设是极短时间内像点的灰度保持不变,只存在位置变化。视觉错觉乍一看好象是总统克林顿和副总统戈尔,但是再仔细看看,是两个克林顿!看看这两张脸,它们是完全一样的,只是这两个人的发型和服饰不同。如果你被这幅图的内容所迷惑的话,你很可能被它愚弄啦!当我们的视觉系统接触一幅图画的时候,它更关注的是整幅图的意义,而并不特别的注重细节。对于这张图,你最容易想到的是左边的是副总统,戈尔的衣服和发型使其更具迷惑性。视觉错觉你看到了什么?那些交叉点是不是在放射火花?在Grid火花错觉中,眼球的运动也是非常重要的。尽管在视觉研究领域有对这种错觉进行全面介绍的文章,但它本质的原因仍然没有被充分的了解。栅格火花错觉•长度与透视:线AB和线CD长度完全相等,虽然它们看起来相差很大。长度与透视曲线正方形•曲线正方形:这些是完全的正方形吗?•【解析】正方形看起来是变形了,但其实它们的边线都是笔直而彼此平行的。比尔·切斯塞尔创作了这个曲线幻觉的视觉艺术版本。•图像变换图像变换目的在于:处理问题简化、有利于特征提取、加强对图像信息的理解。图像变换算法很多,重点学习傅立叶变换的算法、性质和应用。•图像变换图像变换目的在于:处理问题简化、有利于特征提取、加强对图像信息的理解。图像变换算法很多,重点学习傅立叶变换的算法、性质和应用。形成色觉的三要素光源光源对物体的照射,根据物体对光的吸收特性,进行有选择反射观察者,接收物体的反射光,通过视觉系统,形成色知觉光谱颜色的视觉三特征色相是从物体反射或透过物体传播的颜色。在0到360度的标准色轮上,色相是按位置度量的。在通常的使用中,色相是由颜色名称标识的,比如红、橙或绿色。饱和度,有时也称彩度,是指颜色的强度或纯度。饱和度表示色相中灰成分所占的比例,用从0%(灰色)到100%(完全饱和)的百分比来度量。在标准色轮上,从中心向边缘饱和度是递增的。亮度是颜色的相对明暗程度,通常用从0%(黑)到100%(白)的百分比来度量。R、G、B(三基色波长(CIE)Blue:435.8nm,Green:546.1nm,Red:700nm)三种基色三基色混色原理研究发现人眼所能观察到的绝大多数颜色可以通过三种基色混合得到加法混色原理:对应R(红)、G(绿)、B(蓝)三基色。主要应用于光照、视频和显示器中减法混色原理:对应C(纯青色)、M(洋红)、Y(黄色)三基色。主要用于绘画、印刷、印染行业RGB相加混色绝大部分的可见光谱可以用红、绿和蓝(RGB)三色光按不同比例和强度的混合来表示。在颜色重叠的位置,产生青色、洋红和黄色。因为RGB颜色
本文标题:第二章-数字图像处理基本概念
链接地址:https://www.777doc.com/doc-4402047 .html