您好,欢迎访问三七文档
数字图像处理前言数字图像处理(DigitalImageProcessing)是一门关于如何用计算机对图象进行处理的学科。本课程既讲解基本原理和方法,也强调编程实践(MATLAB实现)。教材:数字图像处理及MATLAB实现,余成波编著,重庆大学出版社,2003参考书:1.DigitalImageProcessing,R.C.Gonzalez,PrenticeHall,2002.(中文版,阮秋琦译,电子工业出版社)2.数字图像处理,许录平,科学出版社,20073.Matlab图像处理与应用,董长虹等,国防工业出版社,20044.数字图像处理学VisualC++实现,郎锐编,北京希望电子出版社,20021.1.1图像图像是自然界景物的客观反映,是人类认识世界和人类本身的重要源泉。“图”是物体反射或透射光的分布,它是客观存在的,而“像”是人的视觉系统所接收的图在人脑中所形成的印象或认识。总之,凡是人类视觉上能感受到的信息,都可以称为图像。照片、绘画、影视画面是图像;照相机、显微镜的光学成像也是图像。汉字也可以说是图像的一种;图形也属于图像的范畴。通过某些传感器变换得到的电信号图,如脑电图、心电图等也可看做是一种图像。1.1图像视频(Video):视频图像又称为动态图像、活动图像或者说运动图像。它是一组图像在时间轴上的有序排列,是二维图像在一维时间域上构成的序列图像。如NTSC制式电视30帧/秒,PAL制式是25帧/秒,电影则是24帧/秒。图形(Graphics):图形是图像的一种抽象,它反映图像的几何特征,例如点、线、面等。图形是描述产生图像中的点的过程和方法。除常见的静态图像以外,图像还包含以下几个重要内容:动画(Animation):动画属于动态图像的一种。它与视频的区别在于视频的采集来源于自然的真实图像,而动画则是利用计算机产生出来的图像或图形,是合成动态图像。动画包括二维动画、三维动画等多种形式。符号(Symbol)与文字(Character):符号可以表示许多信息。符号包括各种描述量、数据、语言等。其中最重要的是数值、文字等有结构的符号组。符号是用特定值表示的,如ASCII码、中文国标码等。什么是数字图象?数字图象是指由被称作象素的小块区域组成的二维矩阵。对于单色即灰度图象而言,每个象素的亮度用一个数值来表示,通常数值范围在0到255之间,即可用一个字节来表示,0表示黑、255表示白,而其它表示灰度。如下图所示:125,153,158,157,127,70,103,120,129,144,144,150,150,147,150,160,165,160,164,165,167,175,175,166,133,60,133,154,158,100,116,120,97,74,54,74,118,146,148,150,145,157,164,157,158,162,165,171,155,115,88,49,…………111,114,114,123,126,121,116,110,107,116,116,129,135,134,131,120,126,121,85,32,29,43,33,37,52,32,105,114,117,118,123,122,116,113,118,112,104,108,111,105,113,126,123,107,51,27,25,34,40,35,39,36,灰度图象(128x128)及其对应的数值矩阵(仅列出一部分(26x31))图像是一种空间信息,它具体地表明了事物的形态、位置和色彩等,以便人们进行观察、测量和识别。图像包含了丰富的信息,它直观地提供了景物的颜色、亮度、纹理、位置和形状等。上述信息成为人们理解该图像所表现的事物的基础。图像在人类接收和传递信息中都起着重要的作用。因为图像比起声音、文字信息有其突出的长处,那就是图像的直观性、客观性,它能原封不动地将客观事物的原形展现在眼前。而声音、文字信息则是通过描述来表达事物,即属于描述性的信息。会受到描述者的许多因素的影响,诸如主观、片面、专业、情绪、状态等都会使描述偏离客观事物。1.1.2图像信息的重要性图像信息的重要性还在于人们的视觉系统有着瞬间获取图像、分析图像、识别图像和理解图像的能力。从视觉接受信息的角度看,可认为图像是空间客观景物在眼球视网膜上形成的像。视觉系统和大脑具有高超的能力,能区分图像中的物体与背景;能感知颜色、亮度、形状、方向、位置、运动等信息的细微差别;能将有意义的信息综合成一体;有很强的信息存储能力;具有高效地进行平行处理的能力等等。其实,人们在生活和非自动化生产中,都离不开用视觉获取图像和处理图像。人类通过眼、耳、鼻、舌、身接受信息,感知世界。约有75%的信息是通过视觉系统获取的。数字图象处理是用数字计算机处理所获取视觉信息的技术。1.2图像技术及图像的分类图像技术在广义上是各种与图像有关的技术的总称。数字图像,主要应用的是计算机图像技术。这包括利用计算机和其他电子设备进行和完成的一系列工作。例如:图像的采集、获取、编码(压缩)、存储和传输。图像的合成、绘制和生成、图像的显示和输出。图像的变换、增强、恢复(复原)和重建、分割、目标的检测、表达和描述、特征的提取和测量。……1.2.1图像技术图像处理是比较低层的操作,它主要在图像像素级上进行处理,处理的数据量非常大。图像分析则进入了中层,分割和特征提取把原来以像素描述的图像转变成比较简洁的对目标的描述。图像理解主要是高层操作,操作对象基本上是从描述中抽象出来的符号,其处理过程和方法与人类的思维推理有许多类似之处。(1)灰度分类按灰度分类有二值图像(如图文传真、文字、图表、工程图纸等)和多灰度图像。多层次灰度图像按应用的不同,有各种不同的灰度层次。如计算机打印机中有灰度层次的图像,一般为16、25灰度级,工业电视、可视电话为64灰度级(6bit),气象数字图像为7灰度级,广播电视图像为256灰度级(8bit),医学图像一般为1024灰度级(10bit)。1.2.2图像的分类黑白图像是指图像的每个像素只能是黑或白,没有中间的过渡,故又称为二值图像。二值图像的像素值为0或1。例如011100001I灰度图像灰度图像是指每个像素由一个量化的灰度值来描述的图像。它不包含彩色信息。100220250180501202001500I(2)色彩分类按照色彩分类,可分为单色图像和彩色图像。单色图像指只具有某一谱段的图像,一般为黑白灰度图;彩色图像,包括真彩色、合成彩色、伪彩色等。彩色图像是指每个像素由R、G、B三原色像素构成的图像,其中R、G、B是由不同的灰度级来描述的。00255800255240240255R02550160255255801600G25525525524000160800B++(3)运动分类图像可分为静态图像和动态图像。静态图像包括静止图像和凝固图像。每幅图像本身都是一幅静止图像。凝固图像是动态图像中的某一帧。动态图像的快慢以帧率量度,帧率反映了画面运动的连续性。可以看出,动态图像实际上是由一幅幅静态图像按时间排列组成的。(4)按时空分布分类图像可分为二维图像和三维图像。二维图像即平面图像,其数学表示为f(x,y),f为光强,x,y为二维空间坐标。三维图像即立体图像,其数学表示为f(x,y,z),f为光强,x,y,z为三维空间坐标。1.3图像系统的构成1.3.1图像系统的线性模型由于h(x,y)是当系统的输入为δ函数或理想点光源时系统的输出,是对点光源的响应,因此也称为点扩展函数。当输入的单位脉冲函数延迟了α,β单位后,若有L[δ(x-α,y-β)]=h(x-α,y-β)成立,则称此系统为二维线性位移不变系统。实际中通常把传输或处理图像信号的系统近似为二维线性位移不变系统。当输入为单位脉冲函数δ(x,y)时,输出便为脉冲响应),()],([yxhyxL1.3.2图像处理系统的构成实际的图像处理系统是一个非常复杂、既包括硬件又包括软件的系统。其工作过程如下:对象物反射的光在摄像单元被转换成电信号(模拟信号),再由A/D转换器把其转换成数字信号,被存储在图像存储器中,通过计算机接口送入计算机,做进一步的处理。根据需要再输出、控制。(1)照明方法摄影的时候,给对象物照明用的光源、对象物以及摄像装置三者之间的位置如图1.4所示,其中(a)是背面照明方式、(b)为正面照明方式、(c)为斜射照明方式。1)CCD图像传感器CCD(ChargeCoupledDevices:电荷耦合器件)图像传感器由光电转换单元构成,光电传感单元的排列分为线阵排列和面阵排列两种。图像传感器的工作原理是把光能量转换为电荷,并且具有将转换得到的电荷进行存储的能力,以及使电荷向输出电极移动的扫描能力。一维图像传感器(线阵式传感器)结构模型图中,光电转换部分是由PD1到PDm的m个单元构成,输出经过门驱动开关MOSFET与CCD连接在一起。(2)摄像单元(b)所示为二维CCD传感器,它是由图(a)中的线阵传感器单元从CCD1到CCDnn个单元并列配置而成,并经过一个合成其输出的水平CCD移位寄存器,再经过一个增幅放大器,得到图像信号。2)CCD彩色摄像光学系统的构成对象物反射的光通过透镜和光学低通滤波器之后由三棱镜把光分为RGB三原色,再由3个CCD图像传感器把红R、绿G、蓝B的光信号变换为3个电信号。(3)图像的数字化—般的图像都是模拟图像,即图像上的信息是连续变化的模拟量。对于模拟图像只能采用模拟处理方式进行处理,例如按光学原理用透镜将照片放大。只有将连续的模拟信号变为离散的数字信号,或者说将模拟图像变换为数字图像计算机方能接受。为此,常将计算机图像处理称为数字图像处理。所谓采样指的是空间坐标的离散化,即将图像平面分割成离散点的集合,就是把一幅连续图像在空间上分割成M×N个网格。图像的数字化方法,包括两个方面:采样和量化。采样使连续图像在空间上离散化,但采样点上图像的亮度值还是某个幅度区间内的连续分布。把采样点上对应的亮度连续变化区间转换为单个特定数码的过程,称为量化,即样点亮度的离散化,或者叫做像素的灰度离散化。为了方便计算机进行数据处理,有限个离散值的个数常用2n表示,这个过程是把每一个离散样本的连续灰度只分成有限多的层次,称分层量化。把原图像灰度层次从最暗至最亮均匀分为有限个层次成为均匀量化,如果采用不均匀分层就称为非均匀分层量化。但是,用有限个离散灰度值来表示无穷多个连续灰度的量时,必然产生误差,这种误差称为量化误差(也称为量化噪声)1.4图像质量的评价1.4.1人类的视觉视觉所感受到的图像可看做是三维光辐射场对人眼的影响。目前,在语音、数据、图像三种主要的通信方式中,图像通信起到主要作用。听觉获取的是时间信息,视觉获取的是时空信息;在相同条件下,常规的视频图像的数据量比语音的数据量大600-2500倍。视觉信息是人类从外界获取信息的主要方式。1.4.2人类视觉局限性和机器视觉产生的必然性人的视觉系统可看成是一种神奇的、高度自动化的生物图像处理系统,但是,还存在许多不足之处。3)缺乏持久性:长时间、连续进行相同的视觉处理,人们就会感到单调、疲劳、厌倦、甚至遗忘,以致效率降低或者判别错误。2)局限性:人的视觉系统也有它的局限性。因为只能看到物体表面,不能看到物体内部的结构。1)主观性:人类属于主观动物,在大脑处理图像过程中难免带有主观片面性。4)模糊性:视觉系统的图像处理是一种模糊处理,对处理结果很少能进行定量描述。计算机图像处理是一种能够部分模拟人的视觉系统,而又能部分超越它的性能的新兴技术。1.4.3图像质量的评价方法对于图像处理系统,衡量它的重要指标就是图像的质量。图像质量的含义包括两方面内容:一是图像的逼真度(被评价图像与原标准图像的偏离程度);一是图像的可懂度(指图像能向人或机器提供信息的能力)。主要的评价方法有:(1)图像的主观评价这种方法就是
本文标题:图像处理课件
链接地址:https://www.777doc.com/doc-4490146 .html