您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 空间插值方法对比整理版 (1)
空间插值SpatialInterpolation•空间插值的概念•空间插值的类型•空间插值的方法空间插值概念空间插值——空间插值常用于将离散点的测量数据转换为连续的数据曲面,以便与其它空间现象的分布模式进行比较,它包括了空间内插和外推两种算法。空间内插算法:通过已知点的数据推求同一区域未知点数据。空间外推算法:通过已知区域的数据,推求其它区域数据。空间插值分类1.整体插值、局部插值和边界内插法;2.确定性插值和地统计插值;3.精确插值和近似插值。1、整体插值、局部插值和边界内插法整体插值•整体插值:用研究区所有采样点数据进行全区特征拟合。•整个区域的数据都会影响单个插值点,单个数据点变量值的增加、减少或者删除,都对整个区域有影响。•典型例子是:全局趋势面分析、FourierSeries(周期序列)局部内插法局部内插法只使用邻近的数据点来估计未知点的值,步骤如下:•定义一个邻域或搜索范围;•搜索落在此邻域范围的数据点;•选择能表达这有限个点空间变化的数学函数;•为未知的数据点赋值。局部内插方法:•样条函数插值法•距离倒数插值•Kriging插值(空间自由协方差最佳内插)•……•单个数据点的改变只影响其周围有限的数据点。边界内插法•使用边界内插法时,首先要假定任何重要的变化都发生在区域的边界上,边界内的变化则是均匀的、同质的。•景观单元法、Thiessen多边形法、网格像元法•整体插值方法将小尺度的、局部的变化看作随机和非结构性噪声,从而丢失了这一部分信息。局部插值方法恰好能弥补整体插值方法的缺陷。•整体插值方法通常不直接用于空间插值,而是用来检测总趋势和不同于总趋势的最大偏离部分,即剩余部分,在去除了宏观趋势后,可用剩余残差来进行局部插值。•整体插值方法通常使用方差分析和回归方程等标准的统计方法,计算比较简单。其他的许多方法也可用于整体空间插值,如傅里叶级数和小波变换,特别是遥感影像分析方面,但它们需要的数据量大。整体插值注意的问题2、确定性方法和地统计方法确定性方法•确定性插值法是使用数学函数进行插值,以研究区域内部的相似性(如反距离加权插值法),或者以平滑度为基础(如径向基函数插值法)由已知样点来创建预测表面的插值方法。•全局多项式插值、反距离权插值、径向基插值、局部多项式插值地统计学插值•基于自相关性(测量点的统计关系),根据测量数据的统计特征产生曲面;•克里格方法依赖于数学模型和统计模型,正是由于引入了包括概率模型在内的统计模型,使克里格方法与确定性插值方法区分开来。在克里格方法中预测的结果将与概率联系在一起,即用克里格方法进行插值,一方面能生成预测表面,一方面能给出预测值的误差。•由于建立在统计学的基础上,因此不仅可以产生预测曲面,而且可以产生误差和不确定性曲面,用来评估预测结果的好坏•多种kriging方法3、精确插值和近似插值•精确插值:产生通过所有观测点的曲面。•在精确插值中,插值点落在观测点上,内插值等于估计值。•近似插值:插值产生的曲面不通过所有观测点。•当数据存在不确定性时,应该使用近似插值,由于估计值替代了已知变量值,近似插值可以平滑采样误差。一般插值过程①内插方法(模型)的选择;②空间数据的探索性分析,包括对数据的均值、方差、协方差、独立性和变异函数的估计等;③进行内插;④内插结果评价;⑤重新选择内插方法,直到合理;⑥内插生成最后结果。插值方法选择的原则①精确性:②参数的敏感性:许多的插值方法都涉及到一个或多个参数,如距离反比法中距离的阶数等。有些方法对参数的选择相当敏感,而有些方法对变量值敏感。后者对不同的数据集会有截然不同的插值结果。希望找到对参数的波动相对稳定,其值不过多地依赖变量值的插值方法。③耗时:一般情况下,计算时间不是很重要,除非特别费时。④存储要求:同耗时一样,存储要求不是决定性的。特别是在计算机的主频日益提高,内存和硬盘越来越大的情况下,二者都不需特别看重。⑤可视化、可操作性(插值软件选择):三维的透视图等。插值验证(1)交叉验证交叉验证法(cross-validation),首先假定每一测点的要素值未知,而采用周围样点的值来估算,然后计算所有样点实际观测值与内插值的误差,以此来评判估值方法的优劣。各种插值方法得到的插值结果与样本点数据比较。(2)“实际”验证将部分已知变量值的样本点作为“训练数据集”,用于插值计算;另一部分样点“验证数据集”,该部分站点不参加插值计算。然后利用“训练数据集”样点进行内插,插值结果与“训练数据集”验证样点的观测值对比,比较插值的效果。插值方法1.最近邻法(NearestNeighbor)2.算术平均值(ArithmeticMean)3.距离反比法(InverseDistance)4.高次曲面插值(Multiquadric)5.趋势面插值(Polynomial)6.最优插值(Optimal)7.样条插值(SplineSurface)8.径向基函数插值(RadialBasisFunctions)9.克里金插值(Kriging)10.最小曲率(MinimumCurvature)一、最近邻法(NearestNeighbor)•最近邻点法又叫泰森多边形方法。它采用一种极端的边界内插方法—只用最近的单个点进行区域插值(区域赋值)。•泰森多边形按数据点位置将区域分割成子区域,每个子区域包含一个数据点,各子区域到其内数据点的距离小于任何到其它数据点的距离,并用其内数据点进行赋值。公式其数学表达式为:ievv其中ev表示待估点变量值,iv表示i点的变量值。i点必须满足如下条件:),,min(21eneeeidddd其中22jijiijyyxxd表示点i(xi,yi)与点j(xj,yj)间的欧几里德距离。最近邻法评价•特征:用泰森多边形插值方法得到的结果图变化只发生在边界上,在边界内都是均质的和无变化的;•适用于较小的区域内,变量空间变异性也不很明显的情况。符合人思维习惯,距离近的点比距离远的点更相似,对插值点的影响也更明显;•最近邻法插值的优点是不需其他前提条件,方法简单,效率高;•缺点是受样本点的影响较大,只考虑距离因素,对其他空间因素和变量所固有的某些规律没有过多地考虑。实际应用中,效果常不十分理想。二、算术平均值(ArithmeticMean)算术平均值方法以区域内所有测值的平均值来估计插值点的变量值(Creutin,1982)。算术平均值法评价算术平均值的算法比较简单,容易实现。但只考虑算术平均,根本没有顾及其他的空间因素,这也是其一个致命的弱点,因而在实际应用中效果不理想。三、距离反比法(InverseDistance)距离反比插值方法最早由Shepard提出(RichardFranke,1982)提出的,并逐步得到发展。每个采样对插值结果的影响随距离增加而减弱,因此距目标点近的样点赋予的权重较大。•距离倒数乘方格网化方法是一个加权平均插值法,可以进行确切的或者圆滑的方式插值。方次参数控制着权系数如何随着离开一个格网结点距离的增加而下降。对于一个较大的方次,较近的数据点被给定一个较高的权重份额,对于一个较小的方次,权重比较均匀地分配给各数据点。计算一个格网结点时给予一个特定数据点的权值与指定方次的从结点到观测点的该结点被赋予距离倒数成比例。当计算一个格网结点时,配给的权重是一个分数,所有权重的总和等于1.0。当一个观测点与一个格网结点重合时,该观测点被给予一个实际为1.0的权重,所有其它观测点被给予一个几乎为0.0的权重。换言之,该结点被赋给与观测点一致的值。这就是一个准确插值。距离倒数法的特征之一是要在格网区域内产生围绕观测点位置的牛眼。用距离倒数格网化时可以指定一个圆滑参数。大于零的圆滑参数保证,对于一个特定的结点,没有哪个观测点被赋予全部的权值,即使观测点与该结点重合也是如此。圆滑参数通过修匀已被插值的格网来降低牛眼影响。•反距离权重插值综合了泰森多边形的自然邻近法和多元回归渐变方法的长处,在插值时为待估点Z值为邻近区域内所有数据点都的距离加权平均值,当有各向异性时,还要考虑方向权重。•权重函数与待估点到样点间的距离的U次幂成反比,即随着距离增大,权重呈幂函数递减。且对某待估点而言,其所有邻域的样点数的权重和为1。•决定反距离权重插值法结果的参数包括距离的U次幂值的确定,同时还取决于确定邻近区域的所使用的方法。此外,为消除样点数据的不均匀分布的影响,还可设置引入一个平滑参数,以保证没有哪个样点被赋予全部的权重,即使得插值运算时尽可能不只有一个样点参与运算。•IDW是一种全局插值法,即全部样点都参与某一待估点的Z值的估算;•IDW的适用于呈均匀分布且密集程度足以反映局部差异的样点数据集;•IDW与之前介绍的插值法的不同之处在于,它是一种精确的插值法,即插值生成的表面中预测的样点值与实测样点值完全相等。距离反比插值公式权重系数wj的计算是关键问题,不同类型距离反比法的差别就是权重系数的计算公式不同,因而最后的插值结果也有细微的差别。其数学表达式为:njjjevwv1其中ve(j=1,…,n)是点(xj,yj)的变量值,wj是其对应的权重系数权重系数wj一般由下式给出:niejejjdfdfw1)(其中n是已知点数,ejdf表示对于插值点(xe,ye)与已知点(xj,,yj)之间距离ejd的权重函数。距离反比权重系数的确定ejdf最常用的一种形式是:bejejddf1b是合适的常数。当b取值为1或2时,对应的是距离倒数插值和距离倒数平方插值。b也可以对不同的已知点选择不同的值,即bj。距离反比插值评价•优点——简便易行;可为变量值变化很大的数据集提供一个合理的插值结果;不会出现无意义的插值结果而无法解释。•不足——对权重函数的选择十分敏感;易受数据点集群的影响,结果常出现一种孤立点数据明显高于周围数据点的“鸭蛋”分布模式;•全局最大和最小变量值都散布于数据之中。•距离反比很少有预测的特点,内插得到的插值点数据在样点数据取值范围内。四、高次曲面插值(Multiquadric)高次曲面插值由Hardy于1971年首先提出,随后应用于不同的学科。每个样点对插值点的影响都用样点坐标函数构成的圆锥表示,插值点的变量值是所有圆锥贡献值的总和(Caruso,1998)。插值数学表达式为:其中ci是样本点(xi,yi)的系数,dei是待估点(xe,ye)与样本点(xi,yi)的距离。nieiiedcv1高次曲面插值评价•高次曲面插值根据变量值已知点和变量值未知点的坐标所构成的圆锥,进行插值,为从离散点构建一个连续的表面提供了一个比较优秀的插值方法。•由于在计算权重系数时需要已知点的距离矩阵及其逆矩阵,因而当数据点增多时,矩阵及其逆的求解都比较费时。五、趋势面分析•通常把实际的地理曲面分解为趋势面和剩余面两部分,前者反应地理要素的宏观分布规律,属于确定性因素作用的结果;而后者则对应于微观区域,被认为是随机因素影响的结果。•趋势面分析的一个基本要求就是,所选择的趋势面模型应该是剩余值最小,而趋势值最大,这样拟合度精确度才能达到足够的准确性。•趋势面分析是通过回归分析原理,运用最小二乘法拟合一个二维非线性函数,模拟地理要素在空间上的分布规律,展示地理要素在地域空间上的变化趋势。•在数学上,拟合数学曲面要注意两个问题:一是数学曲面类型(数学表达式)的确定,二是拟合精度的确定。1、趋势面模型的建立•设某地理要素的实际观测数据为zi(xi,yi)(i=1,2,…,n),趋势值拟合值为,则有•用来计算趋势面的数学方程式有多项式函数和傅立叶级数,其中最常用的是多项式函数。因为任何一个函数都可以在一个适当的范围内用多项式来逼近,而且调整多项式的次数,可使所求的回归方程适合实际问题的需要。式中,为剩余值(残差值)2、趋势面模型的参数估计•趋势面分析的核心就是从实际观测值出发推算趋势面,一般采用回归分析方法,使得残差平方和最小从而估计趋势面参数。•假设二维空间中有n个观测点(xl,yl)(l=1,2,…,n),观测值
本文标题:空间插值方法对比整理版 (1)
链接地址:https://www.777doc.com/doc-4292237 .html