您好,欢迎访问三七文档
当前位置:首页 > 财经/贸易 > 资产评估/会计 > P15第十五章-空间插值
第十五章、空间插值SpatialInterpolation•空间插值的基本原理•空间插值方法空间插值导言地理学中可能遇到的问题:了解北京大气质量宏观分布北京大气质量监测点了解我国某个地区的气候状况气象站分布-温度降水某观测站因意外存在缺测、漏测解决问题的难点:到研究区每个点进行观测是非常困难的——时间、人力或财力都不允许。第一节、空间插值的基本原理1.空间插值的概念2.空间插值的理论假设3.空间插值意义4.空间插值分类5.一般插值过程6.插值方法选择的原则7.插值验证8.空间插值的数据取样012345678901234567890123456701234567一、空间插值的概念012345678901234567将空间上离散点的测量数据转换为连续的曲面数据,即填补样本点之间的数据空白,以便与其它空间现象的分布进行建模研究。已知数据函数关系式未知数据从存在的观测数据中找到一个函数关系式,使该关系式最好的逼近这些已知的空间数据,并能根据函数关系式推求出区域范围内其它任意点的值。二、空间插值的理论假设•距离衰减效应空间位置上越靠近的点,越可能具有相似的观察值;而距离越远的点,其特征值相似的可能性越小。•地理学第一定律三、空间插值意义•缺值估计•如何在没有测点的地区得到我们需要的数据?•测点自然或人为的原因,缺少某天或某个时间段的数据。•内插等值线•形象直观的显示空间数据分布•平面制图•数据格网化•以不规则点图元组织的Z变量的数据,并不适合于图形显示,也不适于进行分析。多数空间分析要求将Z值转换成一个规则间距空间格网,或者转换成不规则三角形网。•规则格网数据更好的显示空间数据连续分布四、空间插值分类1.整体插值和局部插值;2.确定性插值和地统计插值;3.精确插值和近似插值。1、整体插值和局部插值•整体插值:用研究区所有采样点数据进行全区特征拟合。•整个区域的数据都会影响单个插值点,单个数据点变量值的增加、减少或者删除,都对整个区域有影响。•典型例子是:全局趋势面分析、FourierSeries(周期序列)局部内插法局部内插法只使用邻近的数据点来估计未知点的值,步骤如下:•定义一个邻域或搜索范围;•搜索落在此邻域范围的数据点;•选择能表达这有限个点空间变化的数学函数;•为未知的数据点赋值。局部内插方法:•样条函数插值法•距离倒数插值•Kriging插值(空间自由协方差最佳内插)•……•单个数据点的改变只影响其周围有限的数据点。•整体插值方法将小尺度的、局部的变化看作随机和非结构性噪声,从而丢失了这一部分信息。局部插值方法恰好能弥补整体插值方法的缺陷。•整体插值方法通常不直接用于空间插值,而是用来检测总趋势和不同于总趋势的最大偏离部分,即剩余部分,在去除了宏观趋势后,可用剩余残差来进行局部插值。整体插值注意的问题2、确定性方法和地统计方法•确定性方法•基于未知点周围点的值和特定的数学公式,来直接产生平滑的曲面;地统计学插值•基于自相关性(测量点的统计关系),根据测量数据的统计特征产生曲面;•由于建立在统计学的基础上,因此不仅可以产生预测曲面,而且可以产生误差和不确定性曲面,用来评估预测结果的好坏•多种kriging方法3、精确插值和近似插值•精确插值:产生通过所有观测点的曲面。•在精确插值中,插值点落在观测点上,内插值等于估计值。•近似插值:插值产生的曲面不通过所有观测点。•当数据存在不确定性时,应该使用近似插值,由于估计值替代了已知变量值,近似插值可以平滑采样误差。五、一般插值过程①内插方法(模型)的选择;②空间数据的探索性分析,包括对数据的均值、方差、协方差、独立性和变异函数的估计等;③进行内插;④内插结果评价;⑤重新选择内插方法,直到合理;⑥内插生成最后结果。六、插值方法选择的原则①精确性:②参数的敏感性:许多的插值方法都涉及到一个或多个参数,如距离反比法中距离的阶数等。有些方法对参数的选择相当敏感,而有些方法对变量值敏感。后者对不同的数据集会有截然不同的插值结果。希望找到对参数的波动相对稳定,其值不过多地依赖变量值的插值方法。③耗时:一般情况下,计算时间不是很重要,除非特别费时。④存储要求:同耗时一样,存储要求不是决定性的。特别是在计算机的主频日益提高,内存和硬盘越来越大的情况下,二者都不需特别看重。⑤可视化、可操作性(插值软件选择):三维的透视图等。七、插值验证(1)交叉验证交叉验证法(cross-validation),首先假定每一测点的要素值未知,而采用周围样点的值来估算,然后计算所有样点实际观测值与内插值的误差,以此来评判估值方法的优劣。各种插值方法得到的插值结果与样本点数据比较。(2)“实际”验证将部分已知变量值的样本点作为“训练数据集”,用于插值计算;另一部分样点“验证数据集”,该部分站点不参加插值计算。然后利用“训练数据集”样点进行内插,插值结果与“训练数据集”验证样点的观测值对比,比较插值的效果。八、空间插值的数据采样•采样点的空间位置对空间插值的结果影响很大。1)理想情况是研究区内均匀布点:但当区域景观存在有规律的空间分布模式时,用完全规则的采样网络可能会得到片面的结果;2)完全随机的采样:采样点的分布位置是不相关的,完全随机采样可能会导致采样点的分布不均,一些点的数据密集,另一些点的数据缺少。3)规则采样和随机采样的结合方法是成层随机采样,即划分为规则格网,每个格网中的样本数固定,但单个点随机地分布于规则格网内。采样方法图示(1)规则采样(2)随机采样(4)成层随机采样(5)聚集采样(3)断面采样(6)等值线采样第二节、插值方法1.最近邻法(NearestNeighbor)2.算术平均值(ArithmeticMean)3.距离反比法(InverseDistance)4.高次曲面插值(Multiquadric)5.趋势面插值(Polynomial)6.最优插值(Optimal)7.样条插值(SplineSurface)8.径向基函数插值(RadialBasisFunctions)9.克里金插值(Kriging)一、最近邻法(NearestNeighbor)•最近邻点法又叫泰森多边形方法。它采用一种极端的边界内插方法—只用最近的单个点进行区域插值(区域赋值)。•泰森多边形按数据点位置将区域分割成子区域,每个子区域包含一个数据点,各子区域到其内数据点的距离小于任何到其它数据点的距离,并用其内数据点进行赋值。公式其数学表达式为:ievv其中ev表示待估点变量值,iv表示i点的变量值。i点必须满足如下条件:),,min(21eneeeidddd其中22jijiijyyxxd表示点i(xi,yi)与点j(xj,yj)间的欧几里德距离。最近邻法评价•特征:用泰森多边形插值方法得到的结果图变化只发生在边界上,在边界内都是均质的和无变化的;•适用于较小的区域内,变量空间变异性也不很明显的情况。符合人思维习惯,距离近的点比距离远的点更相似,对插值点的影响也更明显;•最近邻法插值的优点是不需其他前提条件,方法简单,效率高;•缺点是受样本点的影响较大,只考虑距离因素,对其他空间因素和变量所固有的某些规律没有过多地考虑。实际应用中,效果常不十分理想。二、算术平均值(ArithmeticMean)算术平均值方法以区域内所有测值的平均值来估计插值点的变量值(Creutin,1982)。算术平均值法评价算术平均值的算法比较简单,容易实现。但只考虑算术平均,根本没有顾及其他的空间因素,这也是其一个致命的弱点,因而在实际应用中效果不理想。三、距离反比法(InverseDistance)距离反比插值方法最早由Shepard提出(RichardFranke,1982)提出的,并逐步得到发展。每个采样对插值结果的影响随距离增加而减弱,因此距目标点近的样点赋予的权重较大。距离反比插值公式权重系数wj的计算是关键问题,不同类型距离反比法的差别就是权重系数的计算公式不同,因而最后的插值结果也有细微的差别。其数学表达式为:njjjevwv1其中ve(j=1,…,n)是点(xj,yj)的变量值,wj是其对应的权重系数权重系数wj一般由下式给出:niejejjdfdfw1)(其中n是已知点数,ejdf表示对于插值点(xe,ye)与已知点(xj,,yj)之间距离ejd的权重函数。距离反比权重系数的确定ejdf最常用的一种形式是:bejejddf1b是合适的常数。当b取值为1或2时,对应的是距离倒数插值和距离倒数平方插值。b也可以对不同的已知点选择不同的值,即bj。ARCGIS——IDW•权重过高,较近点的影响较大,拟合表面更细致(不光滑);•权重过低,较远点的影响增加,拟合表面更光滑。缺省值常为2。控制反距离加权的参数—权重1)搜索半径-固定对固定型半径,搜索距离一定,所有在该半径内的样点参与计算。可预先设定一个阈值,当给定半径内搜索到的点小于该值时可扩大搜索半径,直到达到该阈值为止。2)搜索半径类型-可变设定参与计算的样点数是固定的,则搜索的半径是可变的。这样对每个插值点的搜索半径可能都不同,因为要达到规定的点数所需要搜索的区域是不一样的。控制反距离加权的参数—搜索半径可利用一线状和面状数据集来限制样点的搜索。线状数据集可作为平坦地表的悬崖或脊状障碍物:只有位于同侧的样点才符合要求。控制反距离加权的参数—障碍设置权重系数和搜索半径的影响图示Power=2,search=230Power=2,search=150Power=2,search=600Power=4,search=600距离反比插值评价•优点——简便易行;可为变量值变化很大的数据集提供一个合理的插值结果;不会出现无意义的插值结果而无法解释。•不足——对权重函数的选择十分敏感;易受数据点集群的影响,结果常出现一种孤立点数据明显高于周围数据点的“鸭蛋”分布模式;•全局最大和最小变量值都散布于数据之中。•距离反比很少有预测的特点,内插得到的插值点数据在样点数据取值范围内。四、高次曲面插值(Multiquadric)高次曲面插值由Hardy于1971年首先提出,随后应用于不同的学科。每个样点对插值点的影响都用样点坐标函数构成的圆锥表示,插值点的变量值是所有圆锥贡献值的总和(Caruso,1998)。插值数学表达式为:其中ci是样本点(xi,yi)的系数,dei是待估点(xe,ye)与样本点(xi,yi)的距离。nieiiedcv1高次曲面插值评价•高次曲面插值根据变量值已知点和变量值未知点的坐标所构成的圆锥,进行插值,为从离散点构建一个连续的表面提供了一个比较优秀的插值方法。•由于在计算权重系数时需要已知点的距离矩阵及其逆矩阵,因而当数据点增多时,矩阵及其逆的求解都比较费时。五、趋势面分析•通常把实际的地理曲面分解为趋势面和剩余面两部分,前者反应地理要素的宏观分布规律,属于确定性因素作用的结果;而后者则对应于微观区域,被认为是随机因素影响的结果。•趋势面分析的一个基本要求就是,所选择的趋势面模型应该是剩余值最小,而趋势值最大,这样拟合度精确度才能达到足够的准确性。•趋势面分析是通过回归分析原理,运用最小二乘法拟合一个二维非线性函数,模拟地理要素在空间上的分布规律,展示地理要素在地域空间上的变化趋势。•在数学上,拟合数学曲面要注意两个问题:一是数学曲面类型(数学表达式)的确定,二是拟合精度的确定。1、趋势面模型的建立•设某地理要素的实际观测数据为zi(xi,yi)(i=1,2,…,n),趋势值拟合值为,则有•用来计算趋势面的数学方程式有多项式函数和傅立叶级数,其中最常用的是多项式函数。因为任何一个函数都可以在一个适当的范围内用多项式来逼近,而且调整多项式的次数,可使所求的回归方程适合实际问题的需要。式中,为剩余值(残差值)2、趋势面模型的参数估计•趋势面分析的核心就是从实际观测值出发推算趋势面,一般采用回归分析方法,使得残差平方和最小从而估计趋势面参数。•假设二维空间中有n个观测点(xl,yl)(l=1,2,…,n)
本文标题:P15第十五章-空间插值
链接地址:https://www.777doc.com/doc-4914361 .html