您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 中国科学院大学空间分析复习资料
一、名词解释1.估计方差:估计方差是指估计误差的离散程度。估计方差越大,估计误差的离散程度越大。估计误差是指实测值与承载真实值之间的误差。若实测值为:)(ixZ承载真实值为:)(iVxZ。则估计误差为:EmZZExRExZxZxRViiiVi*][)]([)()()(2.随机函数:假设一个样本空间}{,对于每一个样本都有一个函数)(Z,,......3,2,1Ωxxx与之对应,其中nXxXxXxXxn,......,3,2,1321则称)(,....,3,2,1nxxxxZ为定义在)(nXXXX,.....,3,2,1上的随机函数。3.地理可达性(GeographicAccessibility):Accessibilityreferstotherelativeeasebywhichthelocationsofactivities,suchaswork,shopping,andhealthcare,canbereachedfromagivenlocation(BTS,1997)(马)地理可达性是指由一个给定的地点到工作、交通、购物、卫生保健等场所的容易程度。它是研究评价各种服务设施布局及其服务域的重要指标之一,空间距离、交通便捷性、出行成本等是可达性测度的重要因子。(文献)指某一地点到达其他地点、或其他地点到达这一地点的便利程度,是一种对点与线、点与点地理要素进行空间关系分析的过程。其度量指标为个体与其欲到达的兴趣点之间的距离以及不同兴趣点对个体的潜在吸引力规模。(空间可达性,地信B)4.掩膜图层(Mask):预先定义好在一个栅格图层中,哪个区域或哪些像元参与或不参与运算(宋)用选定的图像、图形或物体,对处理的图像(全部或局部)进行遮挡,来控制图像处理的区域或处理过程(百度)5.不规则三角网(TIN,TriangulatedIrregularNetwork):用一组互不重叠的三角形来近似表示地形或曲面的矢量数据格式。通常TIN由点图层生成,每个点都与其最邻近点连接,且三角形尽量密集排列的原则,有时TIN还可以增加线等约束条件。(宋)6.地理案例:地理案例≠地理+案例,它发生在特定的地理空间,且案例受区域分异规律的影响呈现随空间位置变化而变化的特征。它的首要条件是发生在特定案例空间—地理空间,其次它的必要条件为空间位置是最终引起案例间本质区别的因素。(杜)二、简答题1.列出几种常用的空间自回归模型,并简单说明其原理。AICc用来评价模型好坏,越小越好222*][)]([EEVmZZExRVar空间自回归:不仅考虑了因变量Y与自变量X之间的关系,还引入邻居因变量Y变化。有两种思想SimultaneousAutoregressive(SAR),moreglobally;ConditionalAutoregressive(CAR),morelocally.(1)简单线性模型:在统计学中,线性回归是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。一个带有一个自变量的线性回归方程代表一条直线。我们需要对线性回归结果进行统计分析。其实就是最简单的线性回归方程,grobal版,ppt上的例子AICc=382.7(2)滞后模型(lagmodel):在线性模型基础上加上了Y与周围Y的关系(周围Y乘上了一个权重),ppt上的例子AICc=376.3(3)误差模型(errormodel):基本模型与简单线性模型相似,不过在误差中引入邻居误差的影响(即对误差进行空间自回归),ppt上的例子AICc=378.3(4)SAC模型(SACmodel):是滞后模型和误差模型的综合版,不仅之前做了空间自相关,而且在误差项也引入了邻居误差的影响。AICc=378.1还有一种做法,先用空间滤波(SpatialFiltering)的方式,移除空间自相关,然后再用简单线性模型去做。2.简述空间聚类方法的种类与基本原理。(1)层次聚类:通过某种相似性测度计算节点之间的相似性,并按相似度由高到低排序,逐步重新连接个节点。该方法的优点是可随时停止划分,主要步骤如下:(百度)(1)移除网络中的所有边,得到有n个孤立节点的初始状态;(2)计算网络中每对节点的相似度;(3)根据相似度从强到弱连接相应节点对,形成树状图;(4)根据实际需求横切树状图,获得社区结构。(2)划分聚类:给定一个大小为N的数据集,将其分为m类,使类内具有较高的相似度,而类间的相似度较低。(3)密度聚类:基于密度的聚类方法是寻找这样的簇,该簇是基于密度可达性性的最大密度相连对象的集合。不被任何簇所包含的对象被认为是噪声。3.简述空间关系的类型并举例说明。(1)空间方位与距离关系:地理所与北京站。(2)空间拓扑关系:点与点的邻接关系、点与面的包含关系、线与面的相离关系、面与面的重合关系。(3)空间相关:浙江省各市县经济发展空间格局。(4)空间配置关系:南水北调、电网。(5)空间互作用关系:万有引力。(6)空间传播关系:微信朋友圈、疾病。(7)空间网络关系:互联网。(8)空间复杂关系:围棋布局、京津冀城市群。三、论述题1.如何进行相关分析和空间自相关分析,说明其主要的方法和思路,并结合自己的专业谈谈应用。相关分析:(1)用于测试随机变量之间的统计依赖性(马)。(2)相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。(百度)。相关分析的主要内容:(百度)(1)确定现象之间是否存在相关关系,以及相关关系的表现形式。(2)确定相关关系的密切程度。(3)确定相关关系的数学表达式,即回归方程。(4)检验估计值的误差。PS:ppt上的空间自相关Join-countstatistics:空假设:没有空间自相关二值化(B\W),Nominal的映射为k-colouredfactors计算(BB\BW\WW)对应的E()、方差、Z-score如果Z-score大于1.96,则拒绝空假设,是clustering还是dispersion看期望值与随机情况下的对比关系;小于1.96,则random;Lacunarityanalysis:用来判别与空间纹理相关的空间对象的散布(扩散)模式分为五种模式。变化glidingbox大小,计算Lacunarity统计量通过Lacunarity-r图的五条线趋势判断空间自相关关系主要的方法及思路:(1)Pearsoncorrelation(参数方法,变量之间的线性相关性,整个样本的平均响应):(马)皮尔森相关系数等于两个变量的协方差除于两个变量的标准差。样本的简单相关系数一般用r表示,其中n为样本量,分别为两个变量的观测值和均值。r描述的是两个变量间线性相关强弱的程度。r的取值在-1与+1之间,若r0,表明两个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;若r0,表明两个变量是负相关,即一个变量的值越大另一个变量的值反而会越小。r的绝对值越大表明相关性越强,要注意的是这里并不存在因果关系。若r=0,表明两个变量间不是线性相关,但有可能是其他方式的相关(比如曲线方式)(百度)(2)Spearman’srankcorrelation(rho)。是一种测试统计依赖性的非参数方法,适用于连续与离散型变量,刻画的是随机变量之间的单调(monotonic)关系,样本对应排序的响应(马)斯皮尔曼等级相关系数,经常用希腊字母ρ表示。它是衡量两个变量的依赖性的非参数指标。它利用单调方程评价两个统计变量的相关性。如果数据中没有重复值,并且当两个变量完全单调相关时,斯皮尔曼相关系数则为+1或−1。(百度)(3)Kendallrankcorrelation(tau)(马)肯德尔检验是一个无参数假设检验,它使用计算而得的相关系数去检验两个随机变量的统计依赖性。肯德尔相关系数的取值范围在-1到1之间,当τ为1时,表示两个随机变量拥有一致的等级相关性;当τ为-1时,表示两个随机变量拥有完全相反的等级相关性;当τ为0时,表示两个随机变量是相互独立的。(百度)(4)典型相关分析(Canonicalcorrelationanalysis):用于两组变量之间的相关性分析。利用主分量分析的思想,将多个变量和多个变量之间的相关性转化为两个新的综合变量之间的相关,并使得新的综合变量之间存在最大可能的相关。(5)Distancecorrelation(6)Mutualinformation:通过Y对于X不确定程度的减少量。空间自相关分析:空间自相关分析的目的是确定某一变量是否在空间上相关,其相关程度如何。空间自相关分析一般涉及3个步骤(Cliff和Ord,1981;Good-child,1986):①取样,②计算空间自相关系数或建立自相关函数,③自相关显著性检验。空间自相关系数有数种,分别适合于不同数据类型。空间自相关分析在地理统计学科中应用较多,现已有多种指数可以使用,但最主要的有两种指数,即Moran的I系数和Geary的c系数(百度)Moran的I系数:(裴韬地信B)n为观测值数目;yi和yj为某属性特征x在i和j上的观测值;wij为空间权重矩阵,表示区域i与j的邻近关系当Moran’sI大于0时,表明存在正的空间自相关。当Moran’sI小于0时,表明存在负的空间自相关。当Moran’sI接近0时,表明不存在空间自相关,即观测值在空间上随机排列。Geary的c系数(裴韬地信B)其中,n为空间单元的数目,wij为邻接矩阵中的元素,¯y是y的平均值。Geary’sC总是正值,取值范围一般为0到2之间,且服从渐近正态分布。当Geary’sC小于1时,表明存在正的空间自相关。当Geary’sC大于1时,表明存在负的空间自相关。当Geary’sC值为1时,表明不存在空间自相关,即观测值在空间上随机排列。应用:(文献)在1979年,Glick_2就将空间自相关分析引入到美国宾夕法尼亚州肿瘤地理分布变异的研究中。Sokal和Thomson分别以Moran’sI指数、局部Getis—OrdG系数和Geary‘sC系数对南美洲某部落43个村庄村民们的基因多态性进行了局部空间自相关分析,研究结果表明,一个村庄相对于其相邻村庄的位置会影响局部空间自相关分析的结果和遗传基因的多态性.Demirel和Erdogan利用空间自相关分析技术中的全局和局部空间自相关,对1988-2006年土耳其的皮肤利什曼病在各省区分布情况进行分析,以期了解疾病的发展趋势、聚集状况以及病情特殊的省份。结果显示,皮肤利什曼病在各个省份之间不是随机分布的,具有显著的空间聚集性,高发地区集中在东南地区,并且发病有明显朝东南地区发展的趋势。曹志冬、王劲峰等在探寻广州SARS流行的空间风险因子与空间相关性特征时采用采用Moran'sI和LISA统计指数定量分析了广州SARS发病率的全局和局部的空间相关性特征及其时间变化规律,发现SARS发病率的空间聚集性经历了由弱到强再到弱的变化过程,发病率的高值聚集区域主要位于人口密度高、经济活跃、交通发达的城市中心地带,且在整个SARS流行过程中一直没有发生重心转移,2.克里格插值方法主要有哪些类型,分别适用于哪些不同的情况?请结合自己的专业谈谈它们的应用。简单克立格:普通克立格:泛克立格:应用情况:区域化变量Z(x)是非平稳的,即E[Z(x)]=m(x)泛克立格方法可解决的问题:(1)求区域化变量的漂移m(x)(2)求x处的Z(x)值(3)求区域化变量的漂移系数协同克立格:协同克立格是综合多个变量信息的估值方法协同克立格可以提高估值的准确性,并降低估计方差克里金插值法的应用:曹志冬、王劲峰等在探寻广州SARS流行的空间风险因子与空间相关性特征时,以2003年广州市1277例SARS感染者的时空数据为研究对象,利用kriging空间插值技术与核心密度估计技术建立了1km×1km精细格网单元上的发病
本文标题:中国科学院大学空间分析复习资料
链接地址:https://www.777doc.com/doc-2398778 .html