您好,欢迎访问三七文档
遥感图像分类方法比较研究摘要:本文较全面地讨论了遥感图像监督分类和非监督分类中的各种分类方法,及该方法的优缺点、适用场合,并作了简单评价,以期对遥感图像分类方法的研究有新的突破。关键字:遥感;图像分类;分类方法1引言随着空间科技的发展,各种资源环境监测卫星的发射与运行为地表动态变化研究提供了多平台、多光谱、多时相、大范围的实时信息,遥感技术已成为当前人类研究地球资源环境的一种有力技术手段。在遥感技术的研究中,通过遥感影像判读识别各种目标是遥感技术发展的一种重要环节,无论是专业信息提取、动态变化预测,还是专题地图制作和遥感数据库的建立等都离不开分类,对照地面地物类型,便可以从影像上进行地类的识别。随着近年来计算机技术的飞速发展,计算机识别分类成了遥感技术应用的一个重要组成部分。计算机识别分类(即模式识别)就是利用计算机对传感器所收集的遥感信息进行处理、运算,最终分出类别。遥感技术的改进促使遥感专题信息的提取方法也在不断地改进,经历了目视解译、自动分类、光谱特性的信息提取及光谱与空间特征的专题信息提取等多个阶段。遥感影像数据类别多,含混度大,如何解决多类别分类识别并满足一定的分类精度,是当前遥感影像研究中的一个关键问题,也是人们关注的焦点。2基于统计分析的遥感图像分类方法2.1监督分类监督分类是一种常用的精度较高的统计判决分类,在已知类别的训练场地上提取各类训练样本,通过选择特征变量、确定判别函数或判别规则,从而把图像中的各个像元点划归到各个给定类的分类方法[2,3,6,7]。常用的监督分类方法有:K邻近法(K-NearestNeighbor)、决策树法(DecisionTreeClassifier)和贝叶斯分类法(BayesianClassifier)。主要步骤包括:①选择特征波段;②选择训练区;③选择或构造训练分类器;④对分类精度进行评价。最大似然分类法(MLC)是遥感分类的主要手段之一。其分类器被认为是一种稳定性、鲁棒性好的分类器[8]。但是,如果图像数据在特征空间中分布比较复杂、离散,或采集的训练样本不够充分、不具代表性,通过直接手段来估计最大似然函数的参数,就有可能造成与实际分布的较大偏差,导致分类结果精度下降。为此,不少学者提出了最大似然分类器和神经网络分类器。改进的最大似然分类器多采用Gauss光谱模型作为条件概率密度函数模型,其中最简单的是各类先验概率相等的分类器(即通常所说的最大似然分类器),复杂的有Ediriwickrema等提出的启发式像素分类估计先验概率法。MclachlangJ用改进的最大似然分类器提出了EMMLC遥感影像分类算法。通过实际例子的综合比较,EMMLC方法对于比较接近的类别划分要优于传统的MLC方法,同时EMMLC保留了MLC方法Bayes先验知识融合的能力,使得辅助决策知识可以在Bayes理论的支持下参与分类,可以进一步提高分类的有效性。但是,EMMLC只是一定程度上通过补充样本数据来纠正似然函数参数的估计,而每一个类别的分布仍然只是对单峰形式的逼近。在密度分布特别复杂而呈现多峰形式,或者类别间相互交错等情况下,EM算法就需进一步扩展:①用EM算法对每一类密度分布进行再分解;②引进稳健统计理论排除密度分布之间或来自离散点的干扰[9]。神经网络分类器无须考虑先验概率和条件概率密度函数模型,通过对样本反复训练得到判别函数,如Bischof等应用BP网对TM图像分类[10],李祚泳应用BP网对机载MSS的4波段图像分类[11],Salu等应用BinaryDiamond网对TM图像分类等[12]。这2种类型的分类器都具有较好的分类效果,但是,在分类时他们都没有考虑图像类别的空间相关性。通过将光谱空间上的图像像素类别标号过程看成一Markov随机场,可以实现含空间相关性的地物分类。在应用Markov随机场模型分类时,使用的条件概率密度函数模型和参数估计的方法不同,实现也有很大差异,比如Yamazaki等使用启发式的Markov模型对多光谱图像分类[13],条件概率密度函数采用MAR模型,参数估计使用最小均方误差估计,其精度高达98.28%。于秀兰、莫红等用Markov随机场模型进行多光谱遥感图像分类,其精度高于最大似然分类法[14]。监督分类算法在解决分类问题中存在许多不足之处,要么仅仅能解决线性问题[15],要么虽能解决非线性问题,但是计算复杂度高[16],在效率上无法满足要求。为此,近年来的研究热点——支持向量机(SVM)的3大基础理论(结构风险理论、二次优化理论、核空间理论)[17],用于解决非线性问题。如胡自伸等利用葡萄牙里斯本地区TM图像做实验,并同采用神经网络方法的分类精度作比较,其精度高于基于神经网络分类的精度。针对SVM核空间理论中核函数无法根据问题自适应地进行选择这一情况,刘伟强等又提出了一种核函数的选择策略——改进后的自适应最小距离分类法(KAMD)[16]。通过实验,其分类精度明显高于自适应最小距离分类法的分类精度。但是,KAMD法仅在一个核函数集合里有效,不能保证它有效地映射到合适的高维空间。如朱建华利用自适应最小距离方法的监督分类实验表明,该方法精度可达92.9%,适用于多类别遥感图像分类[15]。2.2非监督分类方法非监督分类是在没有先验类别知识的情况下,根据图像本身的统计特征及自然点群的分布情况来划分地物类别的分类处理。非监督分类方法是依赖图像的统计特征作为基础的,它并不需要具体地物的已知知识。采用非监督分类还可以更好地获得目标数据内在的分布规律。非监督分类方法有贝叶斯学习、最大似然度分类以及聚类(Clustering)。无监督的贝叶斯方法和最大似然度方法与有监督的贝叶斯学习以及最大似然度方法基本相同,唯一的区别在于无已知类别的样本可供参考。聚类技术是基于相似度概念和算法将性质很相似的样本聚为一类。目前有效的聚类方法有:(1)超空间分类算法。如K-means聚类[18]。K-means方法属于动态聚类法,它以误差平方和最小作为聚类的评判准则[19]。其优点是通过最小空间距离达到均衡状态,缺点是不能自动确定聚类数。例如陈华、陈书海等利用K-means算法进行遥感分类,取得了很好的效果[19]。(2)ISODATA算法。该算法虽可自迭代由少到多地确定类数,但参数确定困难,一些距离参数要随维数的变化作相应的调整[18~20]。超空间聚类对维数比较高的超谱遥感数据的聚类效果不理想,许多超谱图像聚类算法从所有波段中选择起主要作用的子集,既减少维数,又保留主要信息,但可能同时又丧失一些关键的分类特征。(3)主成分分析算法(PCA)。通过K-L变换抑制具有较少信息量的系数来实现数据维的减少,但求协方差矩阵相当耗时,它将多维光谱信息转换成少数几个主成分,这几个成分包含了大多数的图像信息,提高了分类的效率[21]。(4)独立分量分析(ICA)方法。它能从观测信号出发,估计出已知的信息量很少的源信号,而所获得的源信号是互相独立的。主成分分析是基于二阶统计量的协方差矩阵,而独立分量分析则基于高阶的统计量,不但能实现主成份分析的去相关特性,而且能获得分量之间相互独立的特性。因此,独立分量分析能获得较主成分分析更好的效果。(5)正交子空间投影(OSP)方法[22,23]。该方法选择一些主要目标或方向作为基,然后对所有像素进行正交投影,并在投影数据上继续寻找次优目标或方向。OSP方法主要的基可表示绝大部分信息,从而减少数据维,因其分类结果是混合像元在不同基上的灰度表示,以致分类效果不明显,且分类数受波段数的限制。(6)基于夹角余弦的相似系数聚类方法。如王志刚等[21]将其应用在岩性识别中,吴革洪等[24]将其应用在储层油藏分类中,贺德化等[25]也证明了夹角余弦作为聚类结果的相似性度量指标是合理的,对真实分类下的类内样品差异不敏感,对类间距离差异敏感。通过上述分析可知,基于统计分类的监督和非监督分类方法由于单一地依靠地物的光谱特征,因此对某些地区和某些地物的分类效果不理想,如果对分类器加以改进或者与其它方法结合使用,效果会更好。为此,许多科学工作者在此基础上发展了其它新的分类方法。3人工神经网络分类神经网络属于非参数分类器,该方法用于遥感分类始于1988年。其中多层感知器模型应用最为广泛。人工神经网络是基于生物神经系统的分布存储、并行处理及自适应学习这些现象构造出具有一些低级智慧的人工神经网络系统。当然,这种人工神经网络只是大脑的粗略而简单的模仿,在功能和规模上都比不上真正的神经网络。近年来,神经网络被广泛应用于遥感图像分类。不同学者分别提出或应用BP网[11]、三维Hopfield网[26]、径向基函数神经网络[27]和小波神经网络[28]等对遥感图像进行监督分类。这些神经网络在遥感图像自动分类上都有一定的应用,并取得较好的效果[27-32]。目前常用的方法是Rumlhart、McClelland等提出的前向多层网络的反向传播(BackPropagation)学习算法(简称BP算法)。如,李颖、赵文吉利用Landsat图像分别采用成熟统计方法和流行神经网络方法对北京某地区土地利用信息分类提取,结果表明,神经网络明显优于统计方法[33]。熊桢、童庆禧等利用高阶神经网络算法对北京沙河镇地区的高光谱数据进行了分类实验,取得了很好的效果,其训练样本和测试样本的分类精度达到90%以上[34]。然而,它们的分类精度同样依赖于网络训练样本(教师信号或目标输出)的选取,只是在算法上加以改进,在一定程度上限制了神经网络的发展,BP网等存在网络训练速度慢、对各类分类性能差别较大、不易收敛到最优以及BP网隐层数目和隐层节点数确定较为困难等缺点。为此,美国MathWork公司于1982年推出Matlab,利用Matlab平台构建自组织神经网络来分类遥感图像,希望在没有教师信号的同时同样能达到提高分类精度的目的。张学友、冯学智等利用TM数据对浙江省土地利用信息提取时,比较了BP方法和Kohonen方法,结果表明,用Kohonen方法对图像分类的精度要比用BP方法高出1%-5%[35]。但是,神经网络拓扑结构的选择缺乏充分的理论分析,其链接权值的物理意义不明确,这导致了人们无法理解其进行推理的过程;而一般的模糊系统,其编码的精度较低,缺乏自学习能力。模糊技术和神经网络技术的融合克服了神经网络和模糊逻辑在知识处理方面的缺点[36~38]。采用神经网络来进行模糊信息处理,就可以利用神经网络的学习能力来达到调整模糊规则的目的,从而使模糊系统具备了自适应的特性。为了更好地解决混合光谱的问题,近年来又出现了数学形态学应用于遥感图像处理中,其分类的精度远远高于最大似然法。不久前,加拿大学者将多级形态分解应用于一幅SPOT全色波段图像上的一个子景区土地覆盖的分类处理,经形态边缘检测的分类精度较高[39]。国外在数学形态学应用于遥感图像处理方面的研究相当深入,且颇有新意,应用结果是令人鼓舞的,而国内研究却很少。数学形态学作为遥感图像处理的有效手段之一,有很好的应用前景。4基于多源数据融合的分类多源信息融合就是把多种信息(遥感和非遥感数据)按照一定的方式有机地组合成统一的信息模型。这类方法有基于知识的推理、信息融合、空间数据挖掘等。知识的推理方法可以利用现有的GIS数据和先验知识,可以减少分类时遇到的“同物异谱”和“同谱异物”的现象[5]。信息融合是利用多个遥感信息源所提供的反映所处环境或对象的不同特征信息之间的互补性和冗余性,采用有效的方法将它们融合,弥补单一信息源的缺陷[27]。GIS作为辅助数据用于提高遥感图像分类精度是近年常采用的方法。GIS可作为辅助数据用于训练区的选择、分类数据预分层及分类后处理,或作为附加波段用于分类的过程。例如,R.M.Prol-Ledesma将TM图像和地形图结合采用监督分类方法对Mexico郊区的土地利用变化进行分类,分类精度达到82%[40]。程昌秀在土地利用动态监测中,将土地利用现状的矢量数据与同年同地区的遥感影像做配准与叠加,对于少数地类不单一的图斑做局部边界提取,使分割后输入图斑
本文标题:环境遥感
链接地址:https://www.777doc.com/doc-920468 .html