您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 旅游娱乐 > GIS算法_空间自相关
Lecture4空间自相关数学基础,相关分析,正态分布空间自相关2020/3/91、描述地理数据分布离散程度的指标极差指所有数据中最大值与最小值之差,计算公式为离差指每一个地理数据与平均值的差,计算公式为离差平方和它从总体上衡量一组地理数据与平均值的离散程度,其计算公式为}{min}{maxiiiixxR=xxdii=∑12)(niixxd==方差与标准差方差是从平均概况衡量一组地理数据与平均值的离散程度。方差计算公式为标准差为方差的平方根,计算公式为∑12)(12σnixixn==∑12)(1σniixxn==2、地理相关的意义相关与地理相关相关是指两个或两个以上变数间相互关系是否密切。在研究这种关系时并不专指哪一个是自变量,哪一个是因变量,而视实际需要确定。相关分析仅限于测定两个或两个以上变数具有相关关系者,其主要目的是计算出表示两个或两个以上变数间的相关程度和性质地理相关,就是应用相关分析法来研究各地理要素间的相互关系和联系强度的一种度量指标地理要素之间的相关分析的任务,是揭示地理要素之间相互关系的密切程度。而地理要素之间相互关系的密切程度的测定,主要是通过对相关系数的计算与检验来完成的3、地理相关程度的度量方法简单直线相关程度的度量相关程度研究两个地理要素之间的相互关系是否密切相关方向正相关:y值随x的增加而变大或随x的减少而变小负相关:y值随x的增加而变小或随x的减少而增大相关系数(correlationcoefficient)Covariance相关系数(correlationcoefficient)样本相关系数的计算公式为22()()()()XYXXYYXXYYlrllXXYY()()()()222222∑∑∑∑∑∑∑∑∑∑1)(1)(1)()(iiiyyiiixxiiiiiixyynyyylxnxxxlyxnyxyyxxl======相关系数(correlationcoefficient)rxy为要素x与y之间的相关系数,它就是表示该两要素之间相关程度的统计指标,其值在[-1,1]区间之内rxy>0,表示正相关,即两要素同向发展rxy<0,表示负相关,即两要素异向发展rxy的绝对值越接近于1,表示两要素的关系越密切;越接近于0,表示两要素的关系越不密切•举例,北京市多年各月平均气温与5cm深的平均地温,如表所示,请计算两者的相关系数月份123456789101112气温-4.7-2.34.413.220.224.226.024.619.512.54.0-2.8地温-3.6-1.45.114.522.326.928.226.521.113.44.6-1.9用导出公式nyynxxnyxyxlllriiiiiiiiyyxxxyxy2222相关系数计算表月份气温(x)地温(y)xyx2y21-4.7-3.616.9222.0912.962-2.3-1.43.225.291.9634.45.122.4419.3626.01413.214.5191.40174.24210.25520.222.3450.46408.04497.29624.226.9650.98585.64723.61726.028.2733.20676.00795.24824.626.5651.90605.16702.25919.521.1411.45380.25445.211012.513.4167.50156.25179.56114.04.618.4016.0021.1612-2.8-1.95.327.843.61总和138.8155.73323.193056.163619.119995.0)7.155(12111.3616)8.138(12116.3056)7.155)(8.138(12119.3323)()())((222222nyynxxnyxyxriiiiiiii正态分布生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等正态分布正态分布normaldistribution一种概率分布。正态分布是具有两个参数μ和σ2的连续型随机变量的分布第一参数μ是服从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2)。服从正态分布的随机变量的概率规律为:取μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。空间统计学空间自相关是指空间位置上越靠近事物或现象就越相似,即事物或现象具有空间位置的依赖关系。如气温、湿度等的空间分布体现了与海陆距离、海拔高程的相关性。如果没有空间自相关性,地理事物和现象的分布将是随意的,地理学中的空间分布规律就不能体现。空间自相关性使得传统的统计学方法不能直接用于分析地理现象的空间特征,因为传统的统计学方法的基本假设就是独立性和随机性。为了分析具有空间自相关性的地理现象,需要对传统的统计学方法进行改进和发展,空间统计学就应运而生了。空间自相关有三种:正自相关:是指附近的观测值很可能是彼此相似的负自相关:是指附近的观测值很可能是彼此不同的,较少见零自相关:是指无法辨别空间效应,观测值在空间上似乎是随机分布的空间自相关分析自相关分析的结果可用来解释和寻找存在的空间聚集性或“焦点”。空间自相关分析需要的空间数据是点或面数据,分析的对象是具有点/面分布特性的特定属性。全程空间自相关分析用来分析在整个研究范围内指定的属性是否具有自相关性。局部空间自相关分析用来分析在特定的局部地点指定的属性是否具有自相关性例子测度不同时段少数民族的分化——这种分化的趋势是在扩大还是在减小。总结疾病或趋势在空间和时间上的扩散——也就是说疾病趋势是保持集中在一些地区还是扩散到很多地区。比较一个城市内不同犯罪类型的分布模式比较一个城市内不同时段的人口集中程度Moran’sI统计量moran’sI统计量度量空间自相关(要素属性相近程度)的程度,它的计算不但考虑要素的属性值而且还包括要素之间的距离。给定一系列的要素和相应的属性值,它评估要素的分布是否使集聚分布,离散分布还是随机分布。Moran’s指数接近1表示集聚,接近-1表示离散全局Moran统计量公式:ninjniiijninjjiijxxwxxxxwnI111211ninijijninijjiijwSxxxxw121))((22)(1iixxnSniixnx11;。局部Moran指数被定义为:可进一步写成式中:和是经过标准差标准化的观测值。局部Moran指数检验的标准化统计量为jjijiixxwSxxI)()(2iijjijiixxxxwxxnI2)()()(jjijiTjjijizwzzzzwnzizjz)()()(iiiiIVARIEIIZMoran’sI公式的由来:方差协方差Moran’sI公式的由来:Moran’sI公式的由来:Moran’s指数接近1表示集聚,接近-1表示离散。可以计算出相应的Z值来评价观测的集聚或离散是否统计显著G统计量--高/低集中趋势G统计量全局G统计量的计算公式为对每一个区域单元的统计量为ijijjijiijxxxxwG/ijjjijixxwG/对G统计量的检验与局部Moran指数相似,其检验值为显著的正值表示在该区域单元周围,高观测值的区域单元趋于空间集聚,而显著的负值表示低观测值的区域单元趋于空间集聚,与Moran指数只能发现相似值(正关联)或非相似性观测值(负关联)的空间集聚模式相比,具有能够探测出区域单元属于高值集聚还是低值集聚的空间分布模式。)()()(iiiiGVARGEGGZG统计量--高/低集中趋势Getis-OrdGeneral指数(高/低变化工具)度量对整体区域的高低值的集中度。例1:可以用这个统计工具去比较一个城市内不同犯罪类型的分布模式,这样我们就能够看出该地区是犯罪比较集中(热点地区多),还是犯罪很分散。计算得出很高的值说明在研究区域高于平均值的区域比较聚集。较低的值说明低于平均值的区域趋向聚集。可以计算得出该区域的标准化z值使我们能看出高、低值是否具有统计显著性。例2:比较总结空间现象在不同地方和不同时段的聚集程度。典型的有城市和城市人口集中。用高/低值聚集分析,你能够比较西方城市与东方城市的集聚水平(城市形态学),或者在一个城市内不同时段的人口集中程度的比较(城市增长和密度分析)ArcGIS空间统计工具箱空间统计工具箱是为那些需要使用高级的方法来解决其空间分析问题的gis用户设计的。空间统计主要的工作是研究空间自相关性(SpatialAutocorrelation),分析空间分布的模式,例如聚类(cluster)或离散(dispersed)。通过使用ArcGIS9中的空间统计工具,用户可以以一种非常直观而简单的方式获得这些信息。ArcGIS9中的空间统计工具箱包括了一系列工具,用来分析地理要素的空间分布形态。传统的统计并不考虑地理要素的空间关系,而在空间统计中,要素的空间关系是分析中需要考虑的必要的,处于绝对重要地位的因素。1、nearestNeighborAnalysis1、nearestNeighborAnalysis1、nearestNeighborAnalysisTheratioislessthan1ifthepointpatternismoreclusterthanrandom,andgreaterthan1ifthepointpatternismoredispersedthanrandom.Thez-scoreindicatesthelikelihoodthatthepatterncouldbearesultofrandomchance.TheobservedaveragedistancebetweennearestneighborsTheexpectedaverageforahypotheticalrandomdistributionGlobalMoran’sI:Moran’s指数越接近1表示越集聚,接近-1表示离散,z-scoreindicatethelikelihoodbearesultofrandomchance,如果zscore为正且大于1.96,则分布为聚集的。如果zscore为负且小于-1.96,分布为离散的GeneralGIndex:返回GeneralGIndex值和ZScore值。GIndex值越高,越趋向于高聚类,反为低聚类。Z值为正且越大,要素分布趋向高聚类分布。相反为低聚类分布LocalMoranIAhighpositivezscoresuggeststhatthefeatureisadjacenttofeaturesofsimilarvaluesAhighnegativezscoreindicatesthatthefeatureisadjacenttofeaturesofdissimilarvalues如果索引值I为正,则要素值与其相邻的要素值相近,如果索引I值为负值,则与相邻要素值有很大的不同LocalGstatisticThehighposit
本文标题:GIS算法_空间自相关
链接地址:https://www.777doc.com/doc-4252424 .html