您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > ArcGIS地统计分析方法的应用
ArcGIS地统计分析方法的应用Esri中国(北京)有限公司刘卓颖13:54采矿业13:5413:54海洋学最高温度图里海平均海面温度图6月降水量气象学13:5413:54应用场景13:5413:54讲座内容•地统计相关概念•探索性空间数据分析(ESDA)•空间数据估值方法(重点Kriging)•总结地统计分析工作流程•地统计的地理处理工具13:5413:54地统计相关概念•地统计(Geostatistics)又称地质统计,是在法国著名统计学家G.Matheron大量理论研究的基础上逐渐形成的一门新的统计学分支。•它是以区域化变量为基础,借助变异函数,研究既具有随机性又具有结构性,或空间相关性和依赖性的自然现象的一门科学。•地统计学区别于经典统计学的最大特点即是:地统计学既考虑到样本值的大小,又重视样本空间位置及样本间的距离,弥补了经典统计学忽略空间方位的缺陷。13:5413:54地统计相关基础及概念前提假设-随机过程(非独立)-正态分布-平稳性区域化变量•变量呈现一定的空间分布•区域内位置的不同取不同的值变异分析-协方差函数-半变异函数空间估值地统计分析理论基础包括13:5413:54变异分析变程基台值块金值半变异函数图13:54半变异函数图协方差函数图差值的方差会随距离的增大而增加协方差函数随距离的增大而减小ArcGIS地统计分析•探索性空间数据分析(ESDA)-直方图,QQplot,趋势分析…•确定性插值-IDW,GPI,RBF,LPI•地统计插值-克里金/协同克里金-Ordinary,Simple,Universal,Indicator,Probability,Disjunctive•MovingwindowsKriging•地统计模拟•含障碍的插值方法-核平滑,扩散插值•采样网络设计•面插值•经验贝叶斯克里金插值ArcGIS10的地统计新功能ArcGIS10.1的地统计新功能13:54地统计分析–菜单与工具箱13:54数据格式:矢量数据接受点、线和面作为输入数据。栅格数据ESDA工具不允许将栅格数据用作输入13:54探索性空间数据分析(ESDA)•数据分布在什么地方?•数据点的值是什么?•跟点位置相关的值如何?ESDA基于数据驱动,让数据说明本身13:5413:54探索性空间数据分析(ESDA)计算数据集中的空间依赖性(半变异函数和协方差)半变异函数/协方差云13:54探索性空间数据分析(ESDA)Voronoi图直观地检查数据集的空间可变性和稳定性13:54探索性空间数据分析(ESDA)OzoneNitrogendioxideCrosscovariance(正交协方差)13:54ESDADemoArcGIS地统计空间数据估值方法空间插值确定性插值地统计插值全局性插值:全局多项式插值(GPI)局部性插值反距离权重插值(IDW)径向基插值(RBF)局部多项式插值(LPI)普通克里格插值简单克里格插值泛克里格插值概率克里格插值析取克里格插值协同克里格插值设置障碍插值含障碍核插值含障碍扩散插值面插值经验贝叶斯克里格插值地统计中的插值方法•确定性插值-全局多项式插值(GPI)-径向基插值(RBF)-局部多项式插值(LPI)-反距离权重(IDW)精确性插值13:54全局和局部多项式插值•全局多项式-用一个平面或曲面(多项式)对整个研究区的样点数据集进行全局拟合•局部多项式-利用多个小平面或曲面(多项式)来对研究区的数据集进行拟合反距离权重(IDW)与径向基插值(RBF)•IDW:距离预测位置最近的点分配的权重较大,而权重却作为距离的函数而减小。假设:彼此距离较近的事物要比彼此距离较远的事物更相似。•RBF:是一系列精确插值方法的组合,表面通过每一个测量的采样值。•有以下五种基函数:•薄板样条函数•张力样条函数•规则样条函数•高次曲面函数•反高次曲面函数InverseDistanceWeightsDistanceWeightPower=2Power=1RBF方法是样条函数的一个特例通过选择函数来决定径向表面穿过样本点的方式。地统计中的插值方法的确定性插值DEMO地统计插值•克里金(Kriging):又称空间局部插值法,是以变异函数理论和结构分析为基础,在有限区域内对区域化变量进行无偏最优估计的一种方法.-权重值:-基于空间相关性模型(变异函数).-线性无偏最优估计-考虑了已知样本点的空间分布及与未知样点的空间方位关系基于区域化变量存在空间相关性的假设.具有生成预测表面的能力,提供预测的准确性的度量!为什么要用Kriging插值?有什么优势?13:54地统计插值普通克里金插值(µ是一个未知常量)简单克里金插值(µ是已知常量)泛克里金插值(µ(s)为确定性函数)概率克里金插值(µ是一个未知常量)析取克里金插值协同克里金插值地统计插值Z(s)=µ(s)+ε(s)µ(s)=ß0+ß1x+ß2y+ß3x2+ß4y2+ß5xy13:5413:54Kriging插值的条件•Kriging插值的条件:-正态分布-数据平稳(Stationary)-没有聚类(Noclusters)-没有趋势变化(Notrends)•如何检查这些条件?-ESDAKriging方法的适用范围为区域化变量存在空间相自关性。13:5413:54什么是自相关?Tobler地理学第一法则:任何事物之间均相关,而离的较近事物总比离的较远的事物相关性要高!13:54当存在空间自相关时,使用传统的统计方法将不再可靠13:54如何检查数据是否存在正态分布?如何检查?•直方图-检查是否为钟形分布?-查找离群值•正态QQPlot-检查数据分布是否为45度分布如果数据不是正态分布怎么办?-数据需要进行转换-Log,BoxCox,Arcsin,NormalScore13:5413:54直方图检测是否为正态分布?•需要确认:-直方图为钟形分布-没有异常值-平均值≈中位数-偏斜度(Skewness)≈0-峰态(Kurtosis)≈313:5413:54正态QQPlot—正态分布检测对数转换13:5413:54检查数据是否平稳?•什么是平稳?-两个点位的空间相关只跟距离有关.-数据的方差是恒定的.(当趋势去除以后)•如何检测数据是否为平稳?-Voronoi地图对Entropy或StandardDeviation进行符号化•如果数据非平稳(nonstationary)怎么办?-做变换有时可以稳定方差-EmpiricalBayesianKriging–ArcGIS10.113:5413:54数据是否平稳?•当Entropy或StDev,符号化后,查看随机(randomness)是否被泰森多边形分类了.13:5413:54数据是否有聚类?•数据如果被优先采样,某些位置的采样点密度可能要比其他位置高。-当所寻找到的最邻近的5个邻域时,所有邻域也许都是在同一个类别中.•解决方法:单元去聚(Celldeclustering)和图形•解决方案是对数据进行加权,其中密集采样区域内的数据将获得较小的权重,稀疏采样区域内的数据将获得较大的权重.•根据格网内的点数分配权重13:54网格法图形法13:54数据是否有趋势分布?•什么是趋势?-趋势是在感兴趣区域内数据平均值地系统变化。•如何检查是否有趋势?-ESDA分析•数据有趋势怎么办?-使用趋势去除选择-潜在问题—趋势常无法在自相关和各项异向进行区别.13:5413:54地统计模型1.计算经验半变异函数2.拟合模型3.创建矩阵4.进行预测13:5413:54Kriging插值过程13:5413:54Kriging输出地表类型PredictionErrorofPredictionsQuantile地统计分析提供的多种输出表面类型,为的是准确地代表问题的现象Probability13:54KrigingDemo13:54障碍插值•含障碍的核插值法•含障碍的扩散插值?CostRaster13:54模型诊断交叉验证模型的拟合度怎么样?•不断迭代每一个丢弃样本•使用剩余的样本和Kriging模型估计在已知位置的样本值•比较真值与估计值验证预测的结果如何?•内插不包括子类样本•比较预测值和子类13:5413:54模型比较,选择最优结果•比较有助于确定创建地统计图层的模型相对于其他模型的好坏程度。•创建多个表面,将其中的一个标识为最佳,然后确定它本身即为最终结果。•最佳模型应拥有最接近于0的标准平均值、最小的均方根预测误差、最接近该误差的平均标准误差,以及最接近于1的标准均方根预测误差。13:54地统计分析工作流程数据显示数据分析模型拟合模型诊断模型比较1.数据显示与分析2.选择合适的插值方法3.插值结果校验4.如果有必要重复1-3步5.插值结果制图选择最优结果地统计的地理处理工具•内插•采样网络设计•模拟(高斯地统计模拟)•实用工具•图层转换13:54Modelbuilder+Python13:5413:54高斯地统计模拟(GGS)•GGS:在地统计中是指通过生成多个可能版本的预测表面来扩展克里金法的技术。(条件模拟)•一般插值方法将在一个位置上生成一个预测值。•高斯模拟生成多个的现实,以不同的表现方式表现相同的空间结构。•预测表面集可提供大量的信息,这些信息可用于描述特定位置处预测值的不确定性、感兴趣区中预测值集的不确定性或可用作第二个模型(物质、经济等)的输入的预测值集,以便评估风险并做出更明智的决策。基于数据平稳性的假设−均值,方差和空间结构不随着空间位置的变化而变化13:54N=8N=100N=500Simplekriging每一个表面都可能是真实的现象13:54模拟示例臭氧超标10-70天。13:5413:54总结•插值的表面可以作为GIS建模和分析以及三维的展示的数据源。•大多数GIS建模工具所面对的主要挑战就是,基于现有样本数据尽可能精确地生成表面以及表征预测表面的误差和变异性。•插值表面数据质量的提高就是我们需要解决的问题。13:5413:54学习资源与参考资料•resources.arcgis.com欢迎移步到体验区体验炫彩GIS世界Esri中国(北京)有限公司石羽可视化地理分析建模下一个讲座
本文标题:ArcGIS地统计分析方法的应用
链接地址:https://www.777doc.com/doc-2145688 .html