您好,欢迎访问三七文档
模式识别上机实习报告1一、贝叶斯估计做分类【问题描述】实习题目一:用贝叶斯估计做分类。问题描述:给出试验区裸土加水田的tif图像,要求通过贝叶斯估计算法对房屋、水田及植被进行分类。问题分析:首先通过目视解译法对图像进行分类,获取裸土、水田和植被的DN值,在此基础上,通过该部分各个类别的面积计算先验概率,然后带入公式进行计算,从而对整个图像进行分类。【模型方法】与分布有关的统计分类方法主要有最大似然/贝叶斯分类。最大似然分类是图像处理中最常用的一种监督分类方法,它利用了遥感数据的统计特征,假定各类的分布函数为正态分布,在多变量空间中形成椭圆或椭球分布,也就是和中个方向上散布情况不同,按正态分布规律用最大似然判别规则进行判决,得到较高准确率的分类结果。否则,用平行六面体或最小距离分类效果会更好。【方案设计】①确定需要分类的地区和使用的波段和特征分类数,检查所用各波段或特征分量是否相互已经位置配准;②根据已掌握的典型地区的地面情况,在图像上选择训练区;③计算参数,根据选出的各类训练区的图像数据,计算和确定先验概率;④分类,将训练区以外的图像像元逐个逐类代入公式,对于每个像元,分几类就计算几次,最后比较大小,选择最大值得出类别;⑤产生分类图,给每一类别规定一个值,如果分10类,就定每一类分别为1,2……10,分类后的像元值便用类别值代替,最后得到的分类图像就是专题图像.由于最大灰阶值等于类别数,在监视器上显示时需要给各类加上不同的彩色;⑥检验结果,如果分类中错误较多,需要重新选择训练区再作以上各步,直到结果满意为止。模式识别上机实习报告2【结果讨论】如图所示,通过贝叶斯算法,较好地对图像完成了分类,裸土、植被和水田三个类别清晰地判别出来。在计算先验概率时,选择何种数据成为困扰我的一个问题。既有ENVI自身提供的精确的先验概率值,也可以自己通过计算各个类别的面积,从而获取大致的先验概率值。最后,在田老师的讲解下,我知道了虽然数据可能不太精确,但是,计算先验概率时,总体的倾向是一致的,所以在最后判别时,因此而引起的误差是微乎其微的,所以,一定要弄清楚算法原理,才能让自己的每一步工作都有理可循。模式识别上机实习报告3以上是精度评价,由于目视解译的效果有瑕疵,再加上计算先验概率时存在偏差,导致精度只有七十多,有待改善。模式识别上机实习报告4二、用Fisher准则判别【问题描述】实习题目二:用Fisher准则进行判别。问题描述:给出试验区裸土加水田的tif图像,要求通过Fisher准则进行分类。问题分析:首先通过目视解译法对图像进行分类,获取植被和非植被的DN值,在此基础上,通过一系列矩阵求逆等数学公式的计算,求出可以分开二类样本的直线,然后在此基础上从而对整个图像进行分类。【模型方法】如果在二维空间中一条直线能将两类样本分开,或者错分类很少,则同一类别样本数据在该直线的单位法向量上的投影的绝大多数都应该超过某一值。而另一类数据的投影都应该小于(或绝大多数都小于)该值,则这条直线就有可能将两类分开。准则:向量W的方向选择应能使两类样本投影的均值之差尽可能大些,而使类内样本的离散程度尽可能小。这就是Fisher准则函数的基本思路。wwT0y评价投影方向W的函数:WSWWTWSbWTW)(JF最佳W值的确定:求取使JF达极大值时的w*:)2m-1m(S1-WW*W0的确定:221-W0mm当W0确定之后,则可按以下规则分类,2010wXwXWTwXwXWT【方案设计】考虑Fisher线性判别方法,利用实验1中程序产生的数据(分别在各类样本数均为50及500时),计算:1)求解最优投影方向W;2)求出表示最优投影方向的直线,并且标记出投影后的点在直线上的位置;3)计算投影后的阈值权;4)计算分类器的各类错误率及总的平均错误率;5)计算按最小错误率Bayes决策的错误率(设各类先验概率相同)模式识别上机实习报告5【结果讨论】通过运用三个波段的植被和非植被的DN值,从而获取Fisher判别的分类直线。首先由于计算时需要运用矩阵求逆等各种公式,这一步困扰了我很久,后来在同学的帮助下,自己对算法不断改正,初步达到了计算的要求。计算出投影方向和分割阈值后,对图像进行分类就很轻松了。但是,由于时间的紧迫和自己能力的不足,并没有再对非植被类完成裸土和水田的分割。运用Fisher准则对多类地物进行分割时,可以将多维降低,从而一步步完成分类,这一思路是需要我在实习结束后好好琢磨并完善的。模式识别上机实习报告6以上是精度评价,用Fisher判别对植被和非植被进行判别,效果较好。模式识别上机实习报告7三、K均值聚类判别【问题描述】实习题目三:用K均值聚类对图像进行分类。问题描述:给出试验区裸土加水田的tif图像,要求通过K均值聚类算法进行分类。问题分析:首先通过目视解译法对图像进行分类,获取裸土、水田和植被的DN值,在此基础上,可分为三个聚类中心,将图像上的每个像素点依次分类到三个聚类中,从而完成对图像裸土、水田和植被的分类。【模型方法】K-均值算法的主要思想是先在需要分类的数据中寻找K组数据作为初始聚类中心,然后计算其他数据距离这三个聚类中心的距离,将数据归入与其距离最近的聚类中心,之后再对这K个聚类的数据计算均值,作为新的聚类中心,继续以上步骤,直到新的聚类中心与上一次的聚类中心值相等时结束算法。【方案设计】1、从图像中随机选取三个像素点,作为三个簇的各自的中心。2、分别计算剩下的元素到三个簇中心的相异度,将这些元素分别划归到相异度最低的簇。3、根据聚类结果,重新计算三个簇各自的中心,计算方法是取簇中所有元素各自维度的算术平均数。4、将图像中全部像素点按照新的中心重新聚类。5、重复第4步,直到每个簇的中心基本不再变化。6、将结果输出。模式识别上机实习报告8【结果讨论】如图所示,首先随机选取三个图像的像素点作为聚类中心,在一次次根据距离判断分类后,最后得到三个聚类中心就分别是植被、水田和裸土。在这样的基础上,对图像上每个像素点的DN值进行判断,再根据划分的聚类中心将其归类,最后将图像分成三类,较好地达到了既定目的。模式识别上机实习报告9以上是精度评价,由于K均值聚类中心较为简单,所以评价精度较高,达到了既定目的。模式识别上机实习报告10总结通过本次上机,我对模式识别这门课程有了更深层次的理解。首先是学习并使用Envi,对这个图像处理软件有了初步的掌握。在目视解译时,由于经验不足,错误率较高,以后有待加强。在设计算法时,由于写代码的能力不是很强,所以一些关键代码无法写出来,只能够简单化处理,勉强达到题目的要求。但是,在短短的几次上机中,我收获了很多知识,Bayes二类判别,Fisher判别准则,K均值聚类分析,对这些算法的思路有所了解并加以应用,获益良多。遇到问题时,在同学、学长和老师的帮助下,我一步步攻坚克难,最终完成了老师的要求,比较满意。先说说最大似然估计和贝叶斯估计:这两种方法的前提条件是各类别的条件概率密度的形式已知,而参数类未知。在此情况下,对现有的样本进行参数估计。参数估计在统计学中是很经典的算法,而最大似然估计和贝叶斯估计也是参数估计中常用的方法。最大似然估计是把待估参数看作确定性的量,只是其取值未知,最大似然估计方法所寻找的是能最好解释训练样本的那个参数值,贝叶斯估计把待估参数看作是符合某种先验概率分布的随机变量,而训练样本的作用就是把先验概率转化为后验概率。实际生活中,用的更多的还是最大似然估计,因为此方法更容易实现,而且样本数据充足的情况下,得到的分类器效果比较好。再说说Fisher判别分析法:Fisher判别分析法的基本原理是将多维空间样本点分布的图像投影到二维或者一维,投影方向选择的原则是使两类样本点尽可能分开。求投影方向得到两类点分开的最佳方向也次方向,由这两个方向张成二维平面,可使投影形成二维分类图。垂直于分界线的法线代表使样本向一类或者二类转化的方向。本次模式识别上机结束了,但是,我们的学习还没有结束。之后的大学学习中,要学好专业课程,提升自己图像分类这一方面的能力,为未来的工作奠定良好的基础。
本文标题:模式识别实习报告
链接地址:https://www.777doc.com/doc-6407770 .html