您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 第七章-空间数据分析模型
第七章空间数据分析模型空间数据分析模型一空间数据分析中的若干问题二空间数据关系三空间自相关分析四空间变异性五趋势面分析六区域化变量与克里格插值区分两个概念•空间分析(Spatialanalysis)–对空间对象之间关系的分析–通过分析空间坐标的关系得到对空间对象的关系•空间数据分析(Spatialdataanalysis)–对具有空间坐标的属性数据的分析空间数据分析模型•针对空间数据所建立起来的反映数据空间变异规律的模型,这些模型可以揭示地理现象的本质特征,并用来进行空间预测一空间数据分析中的若干问题•空间自相关•可变区域单位问题•生态学谬误•空间尺度•空间非均一性和边界效应1空间自相关•空间中相近的样点具有某种相似性,相距较远的样点往往不相似-空间自相关空间自相关•空间自相关性使得传统的统计学方法不能直接用于分析地理现象的空间特征•传统的统计学方法的基本假设就是独立性和随机性。为了分析具有空间自相关性的地理现象,需要对传统的统计学方法进行改进与发展,从而产生了空间统计学为什么叫空间自相关?•相关•自相关•空间自相关2可变区域单位问题•统计汇总的区域层次不同,统计结果间的关系也就不同•由汇总单位产生的影响有两个–第一个影响与分析的空间尺度和汇总效应有关。汇总之后的平均值更接近于回归线,使得散点图的结果更接近于线性,导致相关系数增加。一般通过汇总往往产生更好的拟合结果。–第二个影响是不同汇总方法得到的结果实质上是不同的。3生态学谬误•当特定汇总层次的观察值之间的统计关系假定可以接受,并且在更细的层次接受同样关系的时候,产生这个问题•将得到的整体内的关系推论到个体之中4空间尺度•不同对象的表现需要的不同尺度•在大陆尺度,城市用点来表示。在区域尺度,城市用面来表示。在局部尺度,城市成为复杂的点、线、面和网络的集合体。•研究对象的空间尺度影响空间分析。因此,应当选定正确的或合适的空间尺度5空间非均一性和边界效应•区分空间分析与传统统计分析的重要标志是空间的不均一性•边界效应是不均一问题的一个特殊类型二空间数据关系•地理现象的空间连续性是空间属性的最基本性质1.空间格局•存在三种空间格局类型:规则分布,随机分布,聚集分布2空间数据关系•距离(distance)•邻接(adjacency)•交互(interaction)•近邻(neighborhood)距离•空间实体间的直线距离或球面距离D邻接•指定距离内–有相对性•实体相邻D•是名义的、双向的相等的距离交互•是距离和邻接的综合•出发点:事物与近处的关系更密切•从数学上讲,可将两个空间实体之间的交互度表示为0(无交互)和1(高度交互)之间的数1ijkijwd交互的一个定义方式ijijkijppwd近邻•特定空间实体的近邻是与该实体邻接的其他空间实体的集合•近邻依赖于邻接的定义距离、邻接、交互、近邻的关系三空间自相关分析•空间中相近的样点具有某种相似性,相距较远的样点往往不相似-空间自相关•解释和寻找存在的空间聚集性或“焦点”空间自相关的类型•全程自相关•局部自相关–相关的范围自相关性测度•空间数据类型:点或面•Moran’sI,GearyC和G参数(Getis和Ord,1992,1995,1996)•有关算法参PDF1.Moran’sI•包括全程和局部两个参数,用来分析空间的相关性•I值越大,表明正的空间相关性越强2.GerayC参数•进行局部自相关分析•C值大于0,表明正的值四周为高值环绕,小于0,则为低值环绕,0则为无聚集特征。3.G统计量•局部自相关分析•较高的G值表明位置周围是较高的数据,即数据具有聚集性•模拟表明(Ord和Getis1994),在xi周围不存在空间聚集的原假设的条件下,G的分布接近与正态。对于不同的观察值N,在不同的显著性概率下G值各不相同。•例如,在90%的概率下,N=40对应的G值为2.7913。四空间变异分析•特定时刻现象在空间上的变化•地理学的主要研究内容1空间变异空间变异是空间不相似从量变到质变的过程•空间连续性是空间属性的最基本性质•空间中相近的样点具有某种相似性,相距较远的样点往往不相似•不相似性增大到某种程度即产生了空间变异•空间变异–复杂变异–规则变异两种不同认识,但原理上互相联系第一种:实用地、当然地理解变异研究对象均质空间单元构成观察点位的数据可以被外推到更大的区域第二种:通过科学探索来理解变异自然和人类活动导致空间变异的多样性2空间变异模型传统的常规模型具有边界,边界内是均一的现代的连续模型变异是连续的,具有不同的型式对空间变异的处理•传统上,科学家通过定义系统分类单元和均质制图单元来逐渐排除过多的变异,直到可以操作的程度两种模型的差异•假设是均质的•通过采样确定均质区的差异•产生分布图•假设是变异的•通过采样确定变异的程度和范围•产生分布图分析变异的方法•确定性方法–不承认属性观测值的不确定性–连续模型认为性质的变化是一个平稳的可微分过程,而常规模型认为类型图没有内部变异•随机方法–承认所研究的对象是一个复杂的自然体,必须通过采样方法来研究–只能估计其属性的量值而且这些估计受制于概率规则,即任何估计的准确性都只具有某种概率•每一个属性ai在每个图上单元j中的数值都可以估计为Uaij±e,其中e是一个正态分布的随机误差3空间采样从点位值到区域值-两种模型的差异等值线图栅格图计算平均和上色An插值...A1AnA.单值图计算和上色AAnB.单值图加点位数据1...C.点位数据1...A1A...An4空间数据插值•利用点的信息估计未知点的值•存在多种插值方法–GRID–TIN–克里格–等方位差值–趋势拟合法五趋势面分析•空间的变化规律•原因分析•观测面=区域趋势十局部异常+随机干扰什么是趋势面蝗虫密度分级图空间插值观测面观测面:空间上数据的实际分布曲面什么是趋势面趋势面•反映数据在空间上分布主要规律的曲面局部异常=观测面-趋势面观测面=趋势面十局部异常区分趋势和异常•趋势–变化比较缓慢、影响遍及整个研究区的区域成分组成•局部异常–变化比较快,其影响在区内并非处处可见的成分怎么获得趋势面•多项式回归分析–趋势面分析的实质是进行数据的拟合,对因变量无特别的要求,自变量是地理坐标•Y=f(x,y)–Y=c0+a1*x1+b1*y1+c1x1*y1+…•不注重精度和检验六区域化变量与克吕格插值1区域化变量•地统计学方法假定在一定空间范围内性质的变异可以用一个连续随机但是空间上相关的随机域来模拟。这样的性质称为区域化变量•模型Z=m(x)+c’(x)+e’’•半方差函数区域化变量的特点•随机性。即局部不规则的随机性质,可以进行统计推断。•结构性。即存在某种空间自相关,可用某一数学函数来表示。空间平稳性假设•空间变异分析假设存在空间平稳性•随机过程不具有二阶平稳性•1均值平稳性–均值独立于位置,在样本之间是常数•2协方差的二阶平稳性和半方差函数的内秉性平稳–在相同方向和相同距离的任意两点之间的协方差相同。协方差依赖于距离而不是位置度量Z的空间连续性的自然方法是比较间隔为h的两个点x,x+h的值Z(x)和Z(x+h)一个直接的度量关系是两个值间的绝对差dZ(h)=Z(x)-Z(x+h)当dZ很小时两者接近2方差变异函数不同方向的方差云图高程点间的距离高程差异的平方根间隔高度差的平方根XLS草地蝗虫分布的空间变异•倪绍祥教授国家基金的中相关工作•草地蝗虫的危害性5101520半方差图A:各向同性B:各向异性AB半方差模型参数A:各向同性B:各向异性AB3克里格插值•利用原始数据和半方差函数的结构性,对未采样点的区域化变量进行无偏最佳估值的一种方法。该方法的一个有用特点是能够计算出每个估值的误差大小(估值方差),从而能知道估值的可靠性程度。•多种类型,如简单克立格,正常克立格,点状克立格,块段克立格,通用克立格,协克立格,不连续克立格及指标克立格等常用的方法•趋势面•倒数加权•三角网3.1点、块克里格插值•点克里格–估计指定点的值。局部估值方法,每一估值都是由其邻近观测值加权平均计算而得–用于研究指定点值及其可能的变异•块克里格–对中心在X0的小区或块段进行估值–绘制性质的等值线图,图中的等值线较平滑–用于研究变异的区域格局各向同性的点克立格插值3.2泛克里格普通克立格方法(OK)要求数据是二阶平稳的或纯平稳的。如果数据在空间上存在明显的趋势,那么,应该使用泛克立格方法进行分析步骤1趋势分析分析数据中存在的空间上的变化趋势,获得拟合模型。这部分的分析内容与前面的趋势面分析相同2残差的克立格分析与普通克立格分析相同,不同的是,使用的数据是原始数据减去趋势数据,即残差数据3泛克立格插值将趋势面分析和残差的克立格插值结果加和,即构成了泛克立格方法分析的结果泛克立格插值结果3.3协同克里格协同克立格分析是一种空间数据的解释技术,其基本的思想是利用变量之间的空间相关关系进行估计或预测。按照如下的统计准则,它可能是目前最好的空间数据分析方法1)真值和估计值之间不存在偏差2)估计值具有最小的方差要处理的问题是:有两个空间变量,如果第二个变量的分布广,采样密度更高,而第一个变量难以测定或测定的费用较高,那么,可以利用有限样本的变量之间的空间关系来改进对于第一个变量的估计。步骤1定义协同变量(第一个变量和第二个变量)2对两个变量进行半方差分析(包括方差图模型),识别观察值的空间关系特征,并用函数模型化3进行交叉半方差分析,确认两个变量相关性4进行空间估计和预测协同克立格方法在所使用的变量空间模式与常见的物理过程相联系时最为成功。Leenaersetal(1989)荷兰南北Geul河冲积平原表土重金属(Cd,Pb和Zn)含量分布进行制图协同克立格方法污染物总是吸附于缓慢沉降的细颗粒,因此重金属污染分布在长期停留的地方富集。结果发现,冲积平原中泛滥河水停留时间最长的地方重金属含量最高,简单地说该区域相对高程与重金属含量有很强的负相关,据此可以利用高程数据进行重金属含量的协同克立格估值插值蝗虫密度、草场盖度的半方差图和交叉检验图盖度蚁蝗密度蚁蝗密度的协同克立格分析结果使用地统计方法进行空间分析的优缺点仍在争论之中1)克立格是一种最优估值技术,数据符合内蕴假设并且方差函数定义得当的条件下。预测误差与其他局部权重方法相比要低。2)“真实”变异越平滑,方差函数拟合和估值越容易,基底方差也越低,预测误差也低。3)数据越多,方差函数估计越准确。4)一旦实验方差函数拟合成理论方差函数,点位和块段克立格插值方差取决于数据空间结构和方差函数模型的形态,而不是数值本身。常规制图方法的预测误差决定于均质土壤区域的确认。5)块段克立格在点位数据集成到更大区域时非常有用,它通过概括可以降低预测误差。6)大多数插值技巧,包括克立格,都平滑数据,所以极大和极小值都被去除。这些极端值可能有必要保留。7)当数据不足时,所有非地统计方法都可以给出一张图。但是你不知道它的质量到底如何。当数据足以计算方差函数时,克立格方法就具有连续变异的独立样点预测方差而言优于其他方法,当变异不连续时,单值景观制图结果可能更好。8)当数据丰富时,所有插值方法结果相近。效率最高的计算和插值工具就是最好选择。克立格方法的主要困难之一就是缺乏便宜、易用的软件3.4克里格插值的影响因素•数据分布–正态•空间平稳性•样本数量–不小于100,分布比较均匀•不同插值方法–点、块–普通、泛、协同、因子、模糊克里格•不同的参数–块金,误差随块金增加–基台,影响不大–变程,存在最佳的变程值–拟合函数,存在最佳的拟合函数3.5克里格插值的步骤1.分析数据的分布特征,进行必要数据转换2.分析数据的空间变化趋势3.确定变异方差的函数类型4.选择合适的搜索半径和临近数据点数,选择合适的插值方法进行插值
本文标题:第七章-空间数据分析模型
链接地址:https://www.777doc.com/doc-4680801 .html