您好,欢迎访问三七文档
1空间分析:是基于空间数据的分析技术,它以地学原理为依托,通过分析算法,从空间数据中获取有关地理对象的空间位置、空间分布、空间形态、空间形成、空间演变等信息。它具有很强的目的性。是一种面向应用的空2叠置分析是指在统一空间参照系统条件下,把两层或两层以上的专题要素图层进行叠置,以产生空间区域的多重属性特征,或建立地理要素之间的空间对应关系。间处理方法。从叠置条件看,叠置分析分条件叠置和无条件叠置两种,条件叠置是以特定的逻辑、算术表达式为条件,对两组或两组以上的图件中相关要素进行叠置。GIS中的叠置分析,主要是条件叠置。无条件叠置也称全叠置,将同一地区、同一比例尺的两图层或多图层进行叠合,得到该地区多因素组成的新分区图。从数据结构看,叠置分析由矢量叠置分析和栅格叠置分析两种。根据叠置目的的不同可分为合成叠置与统计叠置两类。空间叠置分析根据叠置对象图形特征的不同,分为点与多边形的叠置、线与多边形的叠置、多边形与多边形的叠置三种类型3所谓缓冲区就是根据点、线、面地理实体,建立其周围一定宽度范围内的扩展距离图。缓冲区实际上是一个独立的多边形区域,它的形态和位置与原来因素有关(如下图所示)。如:城市噪音污染源所影响的一定空间范围;交通线两侧划定的绿化带等。实现步骤:1)对每一个条件进行缓冲区范围生成;2)将4个要素生成公共最佳择房区(intersect,erase);3)给每一个缓冲条件添加一个条件判断字段(addfield);4)将4个要素union生成合成图;5)对union后图添加class字段,作为住房分类依据;6)对结果图进行分类分级4泰森多边形分析法是荷兰气象学家A.H.Thiessen提出的一种分析方法。最初用于从离散分布的气象站的降雨量数据中计算平均降雨量。一、泰森多边形的概念和生成二、泰森多边形的特点三、泰森多边形分析的应用设平面上有n个互不重叠的离散数据点,则其中的任意一个离散数据点Pj都有一个临近范围Bi,在Bi中的任一个点同Pj点之间距离小于它同其他离散数据点之间距离。这里的Bi域是一个不规则多边形,该多边形称为泰森多边形。泰森多边形的生成是将所有相邻离散数据点连成三角形,作这些三角形各边的垂直平分线,于是每一个离散数据点周围的若干条垂置平分线相交组成一个多边形,这个多边形就是泰森多边形如图6-11所示。5空间插值是用已知点的数值来估算其它点的数值的过程显示。一般来讲,在已存在观测点的区域内估计未观测点的特征值的过程称数据内插(空间内插),在已存在观测点的区域范围之外估计未观测点的特征值的过程称推估(空间外推)。空间插值方法可以分为整体插值和局部插值方法两类。整体插值方法用研究区所有采样点的数据进行全区特征拟合;局部插值方法是仅仅用邻近的数据点来估计未知点的值。6地理编码(Geocoding)又称地址匹配,简单来说就是根据要素的地址信息(如所在路名及门牌号、所在区域、邮政编码等)得到空间坐标信息。具体说就是:在含地址的表格数据与相关图形数据之间建立联系,从而把地理坐标分配给含相应地址的表格数据记录,并为其创建一个相应的点要素图层。地理编码的原理如同我们在地图上找到一个地址的位置。如地址是路名和门牌号,则需要得到道路图,先根据地址的路名在地图上找到相应的道路,然后根据门牌号找到所在的路段,最后根据路段两段的门牌号码利用内插原理确定位置;如地址是地名,则需要得到反映这些地点(如行政区、城市、地块等)分布的地图,根据地名在地图上找到该区域,并作为该地址的位置,如地点为多边形,通常是以多边形的中心点为地址的位置。进行地理编码的前提:需要有相应的作为地址参照的空间数据,如道路图、分区图等。参考数据需要建立索引,即明确地理编码过程中所需信息对应的字段,如道路名对应的字段等。需要地理编码的对象其地址信息需要符合规范,地址信息规范与所用软件有关。地理编码的方式与地址的形式有关,总的来说,可以分成两大类型:基于道路的地理编码和基于地名的地理编码。基于道路的地理编码是以道路图作为空间参照进行地理编码,根据具体情况又可分为简单的基于道路的地理编码、区分左右的基于道路的地理编码等。7拓扑关系定义——几何对象的排列及其空间相互关系,是几何对象在弯曲或拉伸等变换下仍保持不变的一种性质。拓扑是地理要素间的空间关系,它是确保数据质量的基础。用于保证数据质量的完整性规则、一致性、相邻性、联通性拓扑能提高空间分析能力,并且在确保GIS数据库质量方面扮演了一个重要角色。有利于数据文件的组织,并减少数据冗余。拓扑关系是某些类型GIS分析的必要条件。有助于数字地图的查错。空间数据结构指数据组织的形式,是适合于计算机存储、管理和处理的数据逻辑结构。是地理实体的空间排列方式和相互关系的抽象描述。数据结构是数据模型和文件格式之间的中间媒介。在GIS中主要有栅格和矢量两种数据结构。栅格结构是最简单最直接的空间数据结构,又称为网格结构(raster或gridcell)或像元结构(pixel),是指将地球表面划分为大小均匀紧密相邻的网格阵列,每个网格作为一个象元或象素由行、列定义,并包含一个代码表示该象素的属性类型或量值,或仅仅包括指向其属性记录的指针。8栅格结构是以规则的阵列来表示空间地物或现象分布的数据组织,组织中的每个数据表示地物或现象的非几何属性特征。栅格结构的显著特点是:属性明显,定位隐含。即数据直接记录属性的指针或属性本身,而所在位置则根据行列号转换为相应的坐标,也就是说定位是根据数据在数据集中的位置得到的。由于栅格行列阵列容易为计算机存储、操作和显示,因此这种结构容易实现,算法简单,且易于扩充、修改,也很直观,特别是易于同遥感影像的结合处理,给地理空间数据处理带来了极大的方便。面向位置的数据结构,难以建立空间对象之间的关系栅格数据的获取,主要通过以下四种方法得到:(1)手工网格法:在专题地图上均匀划分网格(或在一张聚酯薄膜上均匀划分网格,而后叠置在地图上),逐个网格的决定其代码,最后形成栅格数字地图文件。(2)扫描数字化法:逐点扫描地图,将扫描数据重采样和再编码得到栅格数据文件。(3)遥感影像数据:将经过分类解译的遥感影像数据直接或重新采样后输入系统,作为栅格数据结构的专题地图。(4)数据结构转换法:利用数字化仪或屏幕跟踪数字化地图,得到矢量结构数据后,再转换为栅格结构。原则:应能有效地逼近空间对象的分布特征,又减少数据的冗余度。格网太大,忽略较小图斑,信息丢失。一般讲实体特征愈复杂,栅格尺寸越小,分辨率愈高,然而栅格数据量愈大(按分辨率的平方指数增加)计算机成本就越高,处理速度越慢。四叉树编码的基本思想是将一幅栅格地图或图像等分为四部分(或四个子区,或四个象限)。逐块检查其格网属性(或灰度值)。如果某个子区的所有格网值都具有相同的值(单一),则这个子区就不再分割,否则(不单一)还要把这个子区再分割成四个子区。这样依次进行分割,直到每个子块都只含有相同的属性值或灰度为止。最后得到一颗四分叉的倒向树。其中最上面的一个结点叫做根结点,它对应于整个图形。不能再分的结点称为叶子结点,可能落在不同的层上,该结点代表子象限单一的代码,所有叶子结点所代表的方形区域覆盖了整个图形。采用四叉树编码时,为了保证四叉树分解能不断地进行下去,要求图像必须为2n×2n的栅格阵列,n为极限分割数,n+1为四叉树的最大高度或最大层数,图2-5-9为23×23的栅格,因此最多划分三次,最大层数为4,对于非标准尺寸的图像需首先通过增加背景的方法将图像扩充为2n×2n的图像。也就是说在程序设计时,对不足的部分以0补足(在建树时,对于补足部分生成的叶结点不存储,这样存储量并不会增加)。方法:常规四叉树(又称指针四叉树),是一种非线性数据结构,当它从上到下进行递归分割时,除了存储叶结点外,还要存储中间结点。通常以子结点和父结点之间设立指针的方式建立起整个结构。按这种方式,四叉树的每个结点通常存储6个量,即四个子结点指针、一个父结点指针和该结点的属性代码。说明:根结点的父结点指针为空,叶结点的子指针为空。这种方法除了要记录叶结点外,还要记录中间结点,一般要占用较大存储空间。另一方面,指针四叉树虽然增加了一些存储量,却换取了处理上的简便和灵活,例如,要将相邻的四块四叉树合并成一棵新树,对指针四叉树来说就十分容易,只要将这四块四叉树作为新树的子树,使它们的根结点指针指向一个共同的根结点就行了。因此,指针四叉树对于数据检索、多要素叠置分析和求实体间的空间关系等操作都很方便。矢量结构是通过记录坐标的方式尽可能精确地表示点、线和多边形等地理实体。矢量结构允许将最复杂的数据以最小的数据冗余进行存储,相对栅格结构来说,数据精度高,所占空间小,是高效的空间数据结构。矢量结构的特点是:定位明显、属性隐含其位置特征是用坐标值直接存储的,而属性特征则一般存于文件头或数据结构中某些特定的位置上(1)手工数字化法:将透明坐标纸蒙在图上,读取图形特征点的X、Y坐标并输入计算机,得到矢量数据。(2)手扶跟踪数字化法:利用数字化仪,跟踪数字化地图,得到矢量结构数据。(3)数据结构转换法:将利用栅格扫描仪采集到的栅格数据转换为矢量数据。9DTM:数字地形(面)模型(DigitalTerrainModel),是地形表面形态属性信息的数字表达,是带有空间位置特征和地形属性特征的数字描述。属性特征如气压、温度、土地利用类型、植被覆盖度和人口密度等。DEM:数字地形模型中地形属性为高程时称为数字高程模型(DigitalElevationModel)。高程是地理空间中的第三维坐标。DTM、DEM关系:数字地形模型中地形属性为高程时称为数字高程模型。DEM可以用于各种地形信息提取,如坡度、坡向、三维正射影像、剖面分析、可视域分析和填挖方分析等。DEM在土木工程设计、军事指挥等众多领域被广泛使用。在地理信息系统中,DEM最主要的三种表示模型是:规则格网模型,等高线模型,不规则三角网模型。TIN(TriangulatedIrregularNetwork)利用所有采样点取得的离散数据,按照优化组合的原则,把这些离散点连接成相互连续的三角面。连接原则:尽可能地确保每个三角形都是锐角三角形或是三边的长度近似相等--Delaunay。不规则三角网是另外一种表示数字高程模型的方法,它既减少规则格网方法带来的数据冗余,同时在计算(如坡度)效率方面又优于纯粹基于等高线的方法。TIN模型根据区域有限个点集将区域划分为相连的三角面网络,区域中任意点落在三角面的顶点、边上或三角形内。如果点不在顶点上,该点的高程值通常通过线性插值的方法得到(在边上用边的两个顶点的高程,在三角形内则用三个顶点的高程)。所以TIN是一个三维空间的分段线性模型,在整个区域内连续但不可微。10所谓空间数据质量是指空间数据在表达实体空间位置、专题特征和时间所能达到的准确性、一致性、完整性和三者统一性的程度,以及数据适用于不同应用的能力。.与数据质量相关的几个概念①准确性(Accuracy)②误差(Error)③精密度(Resolution)④空间分辨率(SpatialResolution)⑤比例尺(Scale)⑥不确定性(Uncertainty)地理信息系统的不确定性包括空间位置的不确定性、属性不确定性、时域不确定性、逻辑上的不一致性及数据的不完整性。元数据的定义“meta”是一希腊语词根,意思是“改变”,“Metadata”一词的原意是关于数据变化的描述,即关于数据的数据。所以,元数据(Metadata),是指描述数据的数据。在地理空间数据中,元数据是说明数据内容、质量、状况和其他有关特征的背景信息。元数据并不是一个新的概念。实际上传统的图书馆卡片、出版图书的版权说明、磁盘的标签等都是元数据。纸质地图的元数据主要表现为地图类型、地图图例,包括图名、空间参照系和图廓坐标、地图内容说明、比例尺和精度、编制出版单位和日期或更新日期、销售信息等。元数据的内容①对数据集的描述②对数据质量的描述③对数据处理信息的说明④对数据转换方法的描述⑤对数据库的更新、集成等的说明11元数据的性质
本文标题:GIS笔记
链接地址:https://www.777doc.com/doc-2873973 .html