您好,欢迎访问三七文档
一、空间数据的插值用各种方法采集的空间数据往往是按用户自己的要求获取的采样观测值,亦既数据集合是由感兴趣的区域内的随机点或规则网点上的观测值组成的。但有时用户却需要获取未观测点上的数据,而已观测点上的数据的空间分布使我们有可能从已知点的数据推算出未知点的数据值。在已观测点的区域内估算未观测点的数据的过程称为内插;在已观测点的区域外估算未观测点的数据的过程称为外推。空间数据的内插和外推在GIS中使用十分普遍。一般情况下,空间位置越靠近的点越有可能获得与实际值相似的数据,而空间位置越远的点则获得与实际值相似的数据的可能性越小。下面介绍一些常用的内插方法。1、边界内插使用边界内插法时,首先要假定任何重要的变化都发生在区域的边界上,边界内的变化则是均匀的、同质的。边界内插的方法之一是泰森多边形法。泰森多边形法的基本原理是,未知点的最佳值由最邻近的观测值产生。如图4-6-1所示。泰森多边形的生成算法见§5.7。2、趋势面分析趋势面分析是一种多项式回归分析技术。多项式回归的基本思想是用多项式表示线或面,按最小二乘法原理对数据点进行拟合,拟合时假定数据点的空间坐标X、Y为独立变量,而表示特征值的Z坐标为因变量。当数据为一维时,可用回归线近似表示为:其中,a0、a1为多项式的系数。当n个采样点方差和为最小时,则认为线性回归方程与被拟合曲线达到了最佳配准,如图4-6-2左图所示,即:当数据以更为复杂的方式变化时,如图4-6-2右图所示。在这种情况下,需要用到二次或高次多项式:(二次曲线)在GIS中,数据往往是二维的,在这种情况下,需要用到二元二次或高次多项式:(二次曲面)多项式的次数并非越高越好,超过3次的多元多项式往往会导致奇异解,因此,通常使用二次多项式。趋势面是一种平滑函数,难以正好通过原始数据点,除非数据点数和多项式的系数的个数正好相同。这就是说,多重回归中的残差属正常分布的独立误差,而且趋势面拟合产生的偏差几乎都具有一定程度的空间非相关性。3、局部内插在GIS中,实际的连续空间表面很难用一种数学多项式来描述,因此,往往使用局部内插技术,即利用局部范围内的已知采样点的数据内插出未知点的数据。常用的有线性内插、双线性多项式内插、双三次多项式(样条函数)内插。(1)、线性内插线性内插的多项式函数为:只要将内插点周围的3个数据点的数据值带入多项式,即可解算出系数a0、a1、a2。(2)、双线性多项式内插双线性多项式内插的多项式函数为:只要将内插点周围的4个数据点的数据值带入多项式,即可解算出系数a0、a1、a2、a3。如果数据是按正方形格网点布置的(如图4-6-3),则可用简单的公式即可计算出内存点的数据值。设正方形的四个角点为A、B、C、D,其相应的特征值为ZA、ZB、ZC、ZD,P点相对于A点的坐标为dX、dY,则插值点的特征值Z为:(3)、双三次多项式(样条函数)内插双三次多项式是一种样条函数。样条函数是一种分段函数,对于n次多项式,在边界处其n-1阶导数连续。因此,样条函数每次只用少量的数据点,故内插速度很快;样条函数通过所有的数据点,故可用于精确的内插,可以保留微地貌特征;样条函数的n-1阶导数连续,故可用于平滑处理。双三次多项式内插的多项式函数为:将内插点周围的16个点的数据带入多项式,可计算出所有的系数。4、移动平均法在未知点X处内插变量Z的值时,最常用的方法之一是在局部范围(或称窗口)内计算个数据点的平均值。既:对于二维平面的移动平均法也可用相同的公式,但位置Xi应被坐标矢量Xi代替。窗口的大小对内插的结果有决定性的影响。小窗口将增强近距离数据的影响;大窗口将增强远距离数据的影响,减小近距离数据的影响。当观测点的相互位置越近,其数据的相似性越强;当观测点的相互位置越远,其数据的相似性越低。因此,在应用移动平均法时,根据采样点到内插点的距离加权计算是很自然的。这就是加权移动平均法,即:其中,λi是采样点i对应的权值,常取的形式有:加权平均内插的结果随使用的函数及其参数、采样点的分布、窗口的大小等的不同而变化。通常使用的采样点数为6—8点。对于不规则分布的采样点需要不断地改变窗口的大小、形状和方向,以获取一定数量的采样点。空间内插方法比较(空间统计学)摘要:空间内插可以分为几何方法、统计方法、空间统计方法、函数方法、随机模拟方法、物理模型模拟方法和综合方法。介绍了每一种方法的适用范围、算法和优缺点。指出没有绝对最优的空间内插方法,必须对数据进行空间探索分析,根据数据的特点,选择最优方法;同时,应对内插结果做严格的检验。开发通用空间内插软件、智能化内插以及加强相关基础研究将是空间内插研究的重点。1空间内插根据已知地理空间的特性探索未知地理空间的特性是许多地理研究的第一步,也是地理学的基本问题。常规方法无法对空间中所有点进行观测,但是我们可以获得一定数量的空间样本,这些样本反映了空间分布的全部或部分特征,并可以据此预测未知地理空间的特征。在这一意义上,空间内插可以被定义为根据已知的空间数据估计(预测)未知空间的数据值。其目标可以归纳为:①缺值估计:估计某一点缺失的观测数据,以提高数据密度;②内插等值线:以等值线的形式直观地显示数据的空间分布;③数据格网化:把无规则分布的空间数据内插为规则分布的空间数据集,如规则矩形格网、三角网等。空间内插对于观测台站十分稀少,而台站分布又非常不合理的地区具有十分重要的实际意义。这些地区的常规观测常常不能满足要求,在这种情况下,利用有限的常规观测估计合理的空间分布,或尽可能地提高数据密度就成为迫切要求。在这些方面,缺值估计和数据格网化将发挥重要的作用。(1)缺值估计。各种科学考察中形式多样的短期观测是提高数据观测密度的重要方式,无形中起到了加密台站的作用;而且由于这些考察常常到达人迹罕至的高海拔和极地等区域,有助于了解区域内观测变量的完整空间分布。但是,这些观测序列往往很短,短则数十天,长不过几年。如何利用周围台站的长序列观测资料和短期观测本身的信息,将观测变量插补到长序列是一个重要问题。(2)数据格网化。规则格网能够更好地反映连续分布的空间现象,并对他们的变化作出模拟。现代地球科学模型和气候模型,如GCM(一般环流模型),都要求与GIS数据模型和遥感数据高度兼容的空间数据集。格网化的数据,尤其是规则矩形格网,已成为目前地学模型的主要数据形式。因此,对已知观测台站的观测数据进行空间内插,得到格网化数据是模型的第一步。空间内插一般包括这样几个过程:①内插方法(模型)的选择;②空间数据的探索分析,包括对数据的均值、方差、协方差、独立性和变异函数的估计等;③内插方法评价;④重新选择内插方法,直到合理;⑤内插。因此,通过比较而选择一个合用的、适合于数据空间分布特点的内插方法是空间内插的关键。本文将空间内插分类为几何方法、统计方法、空间统计方法、函数方法、随机模拟方法、物理模型模拟方法和综合方法,通过比较研究,指出每一种方法的适用范围、算法和优缺点。2空间内插方法比较空间内插可依据:①确定或随机;②点与面;③全局或局部等标准分类。本文依据内插方法的基本假设和数学本质,把空间内插分类为以下几种方法。2.1几何方法是最简单的空间内插方法。几何方法基于“地理学第一定律”的基本假设,即邻近的区域比距离远的区域更相似。几何方法的优点是计算开销少,具有普适性,不需要根据数据的特点对方法加以调整。当样本数据的密度足够大时,几何方法一般能达到满意的精度。几何方法的最大问题是,无法对误差进行理论估计。最常用的几何方法有泰森多边形(最近距离法)和反距离加权方法。2.1.1泰森多边形(最近距离法)泰森多边形用于生成“领地”或控制区域。实际上,尽管泰森多边形产生于气候学领域,它却特别适合于专题数据的内插,因为它生成专题与专题之间明显的边界,不会有不同级别之间的中间现象。泰森多边形的算法非常简单,未采样点的值等于与它距离最近的采样点的值。2.1.2反距离加权方法反距离加权法是最常用的空间内插方法之一。它认为与未采样点距离最近的若干个点对未采样点值的贡献最大,其贡献与距离成反比。可用下式表示:(1)式中,Z是估计值,Zi是第i(i=1,…,n)个样本,Di是距离,p是距离的幂,它显著影响内插的结果,它的选择标准是最小平均绝对误差。Husar等的研究结果表明,幂越高,内插结果越具有平滑的效果。2.2统计方法其基本假设是,一系列空间数据相互相关,预测值的趋势和周期是与它相关的其它变量的函数。统计方法的优点是计算开销不大,有一定的理论基础,能够对误差作出整体上的估计。但是,其前提是一定要有好的采样设计,如果采样过程不能反映出表面变化的重要因素,如周期性和趋势,则内插一定不能取得好的效果。常用的统计方法有趋势面方法和多元回归方法。2.2.1趋势面趋势面根据有限的观测数据拟合曲面,进行内插。它适用于:①能以空间的视点诠释趋势和残差;②观测有限,内插也基于有限的数据。当趋势和残差分别能与区域和局部尺度的空间过程相联系时,趋势面分析最有用。趋势面方法可以被定义为:y=Aθ+e(2)式中,y是n×1维矩阵,对应于n个样本;A是n个样本的坐标矩阵;θ是趋势面参数矩阵。A和θ依赖于趋势面的次数。趋势面的次数是它最重要的特征。e是残差,通常是一个独立随机变量。当残差是随机独立时,统计检验有效;但实际上,趋势面中的残差常是自相关(特别是趋势面的次数较低时),因此,检验是显著有偏差的。残差的空间自相关可以用随机过程模型模拟。由于趋势面的以上特性,它的目标有时并非最佳拟合,而是把数据分成区域趋势组分和局部的残差。2.2.2多元回归在各种统计方法中,使用较多的是回归分析,其特点是不需要分布的先验知识。多元回归在数学形式上与趋势面很相似,但是,它们又有着显著的不同。首先,在趋势面分析中,A是坐标矩阵,而在回归分析中,它可以是任意变量。其次,在趋势面方法中,模型的拟合严格地遵从自常数、一次、二次、立方等的顺序,主要的问题是确定模型的次数,因此,趋势面分析有内在的多重共线性问题;而在多元回归中,尽管也存在多重共线性,但它并非内在的,可以通过逐步回归解决,因此,相对于趋势面的选择次数,多元回归的核心问题是选择变量(主成分分析等方法有助于选择变量)和区分模型。2.3空间统计(Geostatistics)方法空间统计又称地质统计学,于20世纪50年代初开始形成,60年代在法国统计学家Matheron的大量理论研究工作基础上逐渐趋于成熟。其基本假设是建立在空间相关的先验模型之上的。假定空间随机变量具有二阶平稳性,或者是服从空间统计的本征假设(intrinsichypothesis。则它具有这样的性质:距离较近的采样点比距离远的采样点更相似,相似的程度、或空间协方差的大小,是通过点对的平均方差度量的。点对差异的方差大小只与采样点间的距离有关,而与它们的绝对位置无关。空间统计内插的最大优点是以空间统计学作为其坚实的理论基础,可以克服内插中误差难以分析的问题,能够对误差做出逐点的理论估计;它也不会产生回归分析的边界效应。缺点是复杂,计算量大,尤其是变异函数(variogram)是几个标准变异函数模型的组合时,计算量很大;另一个缺点是变异函数需要根据经验人为选定。空间统计方法以Kriging及其各种变种(Cokriging等)为代表。2.3.1Kriging内插(1)Kriging内插的公式Kriging内插由南非地质学家Krige发明,并因此而命名。Matheron给出了Kriging的一般公式。Kriging内插的公式为:(3)式中,z(xi)为观测值,它们分别位于区域内xi位置;x0是一个未采样点;λi为权,并且其和等于1。即(4)选取λi,使z⌒(x0)的估计无偏,并且使方差σ[DD(-*2]⌒[][DD)]2e小于任意观测值线形组合的方差。最小方差由下式给定:(5)它由下式得到:(6)式中,γ(xi,xj)是z在采样点xi和xj之间的半方差(semi-variance),γ(xj,x0)是z在采样点xi和未知点x0之间的半方差,这些量都从适宜的变异函数得到。φ是极
本文标题:空间内插方法比较
链接地址:https://www.777doc.com/doc-3574958 .html