您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > ARCGIS空间统计
ArcGIS空间统计分析目录•空间统计分析概述•ArcGIS空间统计分析•ArcGIS空间统计分析模块介绍•空间分布特征分析•空间分布模式分析•空间关系建模•案例分析•相关资源PEKINGUNIVERSITY2空间统计分析概述•什么是空间统计分析?将空间信息(面积、长度、邻近关系、朝向和空间关系)整合到经典统计分析中,以研究与空间位置相关的事物和现象的空间关联和空间关系,从而揭示要素的空间分布规律。•为什么要使用空间统计分析?空间统计分析使我们更深入、定量化的了解-空间分布-空间聚集或分散-空间关系PEKINGUNIVERSITY3空间统计分析概述•我们能用空间统计分析做什么?空间分布特征识别•根据气象站点的记录,冬季的盛行风行是什么?•地区人口中各种族的聚居分布中心在哪?各种族的空间隔离度有多大?空间分布模式分析•哪里是生物多样性最高且栖息条件最好的地方?•富裕区和贫困区地过渡界限在哪里?随着时间推移,贫富居住是否更为集聚?空间关系建模•为什么在某些特定区域癌症发病率如此高?哪些因素的分布会影响发病率的地区差异?PEKINGUNIVERSITY4ArcGIS空间统计分析——模块介绍ArcGIS空间统计分析工具箱共包含6个工具包26个工具,主要覆盖了三个功能。与其他工具箱不同的是,空间统计工具箱中的很多工具都是提供Python源代码的,是可以进行调试的。还有较多工具是在ModelBuilder中根据已有工具构建的。不同于其他工具箱仅输出结果的数据文件,ArcGIS空间统计分析工具箱的结果有很多重要的结果信息是输出到结果窗口里的。PEKINGUNIVERSITY5ArcGIS空间统计分析——空间分布特征空间分布特征识别解决的问题要素分布的地理中心在哪?要素分布是否有特定的方向?集中特征分析包括了中位数中心、平均中心、中心要素、标准距离和线性方向均值这六个工具。PEKINGUNIVERSITY6ArcGIS空间统计分析——空间分布特征三个中心中位数中心:识别使数据集中要素之间的总欧氏距离达到最小的位置。平均中心:识别一组要素的地理中心(或密度中心)。中心要素:标识出点、线或面要素类中位于最中央的要素。各自特点:与平均中心相比,中位数中心是一种更为典型的中心趋势量度;对于中位数中心来说,数据离群值对结果位置的影响更小;中心要素则是在已有要素中选取。两者的具体应用:可以通过将911紧急电话的平均中心与紧急响应站的位置进行比较来评估服务水平;对超过65岁的人口加权,求得其平均中心,从而确定街区老年服务站的理想位置。PEKINGUNIVERSITY7老年人口分布调查结果老年服务站最佳位置ArcGIS空间统计分析——空间分布特征标准距离测量要素在几何平均中心周围的集中或分散的程度。一个标准差圆面约包含聚类中68%的要素;两个标准差圆约包含聚类中95%的要素;三个标准差约包含聚类中99%的要素。应用:针对某个区域内各响应消防站在几个月内接到的紧急电话的分布情况进行度量和比较,以了解哪些消防站响应的区域较广。线性方向平均值识别一组线的平均方向、长度和地理中心。应用:根据气象站点的记录,冬季的盛行风行是什么?平均风速有多少?PEKINGUNIVERSITY8ArcGIS空间统计分析——空间分布特征分散分布特征——标准差椭圆创建标准差椭圆以汇总地理要素的空间特征:中心趋势、离散和方向趋势。椭圆大小选择:一个标准差椭圆面约包含聚类中68%的要素,两个标准差约包含聚类中95%的要素,三个标准差约包含聚类中99%的要素。与标准距离不同的是,标准差椭圆能标示出要素分布的特定方向,因而更能体现离散的分布特征。案例:在某城市中有4类人种,以各街区的人口普查数据来分析种族融合程度。PEKINGUNIVERSITY9ArcGIS空间统计分析——空间分布模式空间分布模式:从经典统计学的角度出发,结合要素的空间分布,以统计因子描述空间分布ArcGIS中有两组工具用于空间模式分析:全局统计:从总体上判断要素的分布状态(集聚、分散)局部统计:识别要素聚类或分散的位置和程度(热点、冷点)PEKINGUNIVERSITY10ArcGIS空间统计分析——空间分布模式什么是Z得分,什么是P值?如同一般统计检验都假设样本服从某一分布模式一样(如正态分布),模式分析工具的先验假设是完全空间随机性(CSR)。Z得分表示标准偏差,P值表示要素分布是完全空间随机分布的概率。z得分和p值都与标准正态分布相关联。模式分析工具得到Z得分和P值之后,若P值大于0.1,则说明要素分布呈现空间随机性。否则,例如Z=-2.00,P=0.04,则说明在置信度为95%时,要素呈现空间负相关。=2.095%的置信区间内判断要素空间正相关ArcGIS空间统计分析——空间分布模式空间自相关——Moran'sI系数判断要素的属性分布是否有统计上显著的聚集或分散现象,以探讨数据的空间相关性,可以从结果窗口获取结果。Moran’sI系数取值范围为[-1,1]空间集聚:高低值要素分别聚集,高值被高值要素包围,低值被低值要素包围,反之则为空间分散当Z得分或P值指示统计显著时,如果Moran’sI指数值为正则表示要素分布为聚集分布,如果Moran’sI指数值为负则表示要素分散分布。当Z得分或P值指示统计不显著时,空间要素分布呈现空间随机性。对不同时间的同类要素的分布模式,Z分值越大,聚集程度越大。PEKINGUNIVERSITY12ArcGIS空间统计分析——空间分布模式Moran’I指数的应用纽约州1969、1985、2002的人均年收入(县统计单元)空间分布。得到结论:随着时间推移,穷人和富人在空间上分离度下降PEKINGUNIVERSITY13196919852002Z-Value=5.21Moran’I=0.40Z-Value=4.26Moran’I=0.33Z-Value=2.40Moran’I=0.16ArcGIS空间统计分析——空间分布模式高/低聚类和热点分析使用Getis-OrdGeneralG统计可度量高值或低值的聚类程度,并识别具有统计显著性的热点和冷点。热点:要素应具有高值,且被其他同样具有高值的要素包围;冷点:要素具有低值,且同样被低值要素包围。高/低聚类的结果:P值较小且在统计上显著,当Z0时,高值在研究区聚类,聚集区为热点;Z0,低值在研究区聚类,聚集区为冷点。P值较大,则统计上不显著,呈现空间随机性。应用:在访问急症室的次数中查找出现的异常峰值,确定疾病集中爆发的位置;犯罪分析、流行病学、投票模式分析、经济地理学、零售分析、交通事故分析以及人口统计学等领域也有广泛应用。PEKINGUNIVERSITY14地震活动强度的冷热点分析冷点热点ArcGIS空间统计分析——空间分布模式高/低聚类与空间自相关的区别计算的函数不同结果的解释适用的情况:当存在完全均匀分布的值并且要查找高值的异常空间峰值时,首选高/低聚类工具。遗憾的是,高值和低值同时聚类时,它们倾向于彼此相互抵消。如果在高值和低值同时聚类时测量空间聚类,则使用空间自相关工具。举例,胖瘦的座位分布PEKINGUNIVERSITY15结果高/低聚类空间自相关p值不具有统计学上的显著性。不能拒绝零假设。要素属性值的空间分布很可能是随机空间过程的结果。p值具有统计学上的显著性,且z得分为正值。可以拒绝零假设。数据集中高值的空间分布与预期的空间分布相比在空间上的聚类程度更高。可以拒绝零假设。数据集中高值和低值的空间分布在空间上聚类的程度要高于预期。p值具有统计学上的显著性,且z得分为负值。可以拒绝零假设。数据集中低值的空间分布与预期的空间分布相比在空间上的聚类程度更高。可以拒绝零假设。数据集中高值和低值的空间分布在空间上离散的程度要高于预期。离散的空间模式通常反映某种类型的竞争过程:具有高值的要素排斥具有高值的其他要素;类似地,具有低值的要素排斥具有低值的其他要素。ArcGIS空间统计分析——空间关系建模回归分析是研究两个或两个以上的变量之间关系的一种统计方法。空间回归在经典统计回归分析中考虑了空间自相关性,通过空间关系把属性数据与空间位置关系结合起来,空间回归可以更好的解释地理事物的空间关系.ArcGIS中空间关系建模包括两种回归工具:普通最小二乘法(OLS)和地理加权回归(GWR),还有两个系数辅助工具。普通最小二乘法与SPSS等统计软件的功能类似,而地理加权回归则比普通最小二乘法更适合于空间数据,并且其回归结果往往优于OLS。PEKINGUNIVERSITY16ArcGIS空间统计分析——空间关系建模普通最小二乘法(OLS)即多元线性回归,选择一个或几个自变量来对某个因变量做出解释,探讨自变量和因变量之间的关系。例如:探讨到地铁站的距离、周围购物中心数量、小区绿化率等因素对于某城市的房价的影响。OLS模型的一般表达式为:ArcGIS、SPSS、Stata等软件均可以完成多元线性回归的任务。ArcGIS只默认一种模式——进入,即所有的自变量均进入最终的结果,而经典统计软件一般都有逐步回归(Stepwise)的功能。PEKINGUNIVERSITY17ArcGIS空间统计分析——空间关系建模普通最小二乘法(OLS)结果解释与验证各项因子的符号与预期的符号一致;方差膨胀因子VIF:自变量是否存在多重共线性;T检验等因子是否在统计上显著;模型的修正R方是否够大,对因变量的解释百分百;模型的残差符合正态分布,且不存在空间自相关;PEKINGUNIVERSITY18ArcGIS空间统计分析——空间关系建模为什么要使用地理加权回归(GWR)OLS在处理空间数据上的不足:OLS可以构造出最佳描述研究区域中整体数据关系的方程。然而现实中通常研究区内的数据并非全局一致的,在不同位置具有不同的表现形式。GWR处理空间数据的优势:基于地理学第一定律,考虑了局部特征;更适用于空间数据的回归,既使用了空间信息,又使用了属性信息;模型的结果较OLS更好(修正R2更大,残差更小,残差的空间相关性更小)高大上,更容易发paperPEKINGUNIVERSITY19-100102030405060700510152025因变量y解释变量xArcGIS空间统计分析——空间关系建模地理加权回归(GWR)介绍地理加权回归模型是对普通线性回归模型的扩展,将数据的地理位置嵌入到回归参数之中,即:这里(𝑢𝑖,𝑣𝑖为第i个采样点的坐标(如经纬度),𝛽𝑘(𝑢𝑖,𝑣𝑖称为空间权重矩阵,是第i个采样点上的第k个回归参数,它是地理位置的函数,𝛽𝑘(𝑢𝑖,𝑣𝑖取决于带宽(BandWidth)的设置。GWR的核心便是:PEKINGUNIVERSITY20𝑦𝑖=𝛽0(𝑢𝑖,𝑣𝑖+𝛽𝑘(𝑢𝑖,𝑣𝑖𝑝𝑘=1⋅𝑥𝑖𝑘+𝜀𝑖,𝑖=1,2,...,𝑛选定一定区域内的观测点带入回归计算各观测点的计入权重不同带宽权重函数ArcGIS空间统计分析——空间关系建模GWR中带宽确定了局部回归的范围,空间权重矩阵(函数)𝛽𝑘(𝑢𝑖,𝑣𝑖一个显著的特点就是距离核越远,其值越小,这是地理学第一定律决定的。GWR的核心是空间权重矩阵的确定,即带宽的设置。带宽确定了局部带宽的形状和大小取决于用户输入的核类型、带宽方法、距离以及相邻点的数目参数。ArcGIS中核类型方法有固定距离(FIXED)和自适应权重(ADAPTIVE)两种方法,固定距离意味着带宽是一定的,而自适应权重的带
本文标题:ARCGIS空间统计
链接地址:https://www.777doc.com/doc-3267088 .html