您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 第二章 地理信息系统的数据结构
复习举例说明什么是数据和信息?地理数据的特点?地理信息系统的组成部分?主要功能有哪些?第二章地理信息系统的数据结构地理实体的表达位置几何形态(矢量数据模型和栅格数据模型)、属性相互之间的关系空间数据的其他数据结构类型①矢量数据结构②曲面数据结构③栅格数据结构位置地理空间的概念地理空间一般指上至大气电离层,下至地壳与地幔交界的莫霍面之间的空间区域。地理空间定位框架即大地测量控制,由平面控制网和高程控制网组成;目前,我国采用的大地坐标系为1980年中国国家大地坐标系,现在规定的高程起算基准面为1985国家高程基准。GIS的任何空间数据都必须纳入一个统一的空间参照系统中,以实现不同来源数据的融合、连接与统一;地理实体的几何形状和空间分布计算机中空间实体的表达在计算机中,现实世界是以各种数字和字符形式来表达和记录的;对现实世界的各类空间对象的表达有两种方法,分别称为矢量表示法(矢量数据模型)和栅格表示法(栅格数据模型),如下图。湖泊河道居民地流路点:位置:(x,y)线:位置:(x1,y1),(x2,y2),…,(xn,yn)面:位置:(x1,y1),(x2,y2),…,(xi,yi),…,(xn,yn)为使计算机能够处理数据,矢量数据模型的数据准备一般包括以下2个基本步骤:首先,用点及其x,y坐标来表示空间要素如点、线和面;其次将几何对象及其空间关系组织成数字化数据文件,使得计算机可以访问、编译和处理。矢量数据结构矢量数据结构是利用欧几里得几何学中的点、线、面及其组合体来表示地理实体空间分布的一种数据组织方式;点:零维线:一维面:二维体:三维时间:通常以第四维表达注意:空间对象的维数与比例尺是相关的。例如河流的上游可能被表示为单线,但是其下游却可能被表示为一个面。矢量数据结构分为简单数据结构(点、线、面)、拓扑数据结构(描述实体间空间位置关系)和曲面数据结构(体),例如以ESRI公司的数据格式为例:Shape文件(简单数据结构)Coverage文件(拓扑数据结构)TIN(曲面数据结构)地理实体之间相互关系地物对象或地理实体使用点、线、面和体表达后,这些实体之间的关系如何来描述?例如人在社会的关系为什么要描述这种关系呢?地理学第一定律(Tobler‘sFirstLaw或者Tobler’sFirstLawofGeography)allattributevaluesonageographicsurfacearerelatedtoeachother,butcloservaluesaremorestronglyrelatedthanaremoredistantones。地理事物或属性在空间分布上互为相关,存在集聚(clustering)、随机(random)、规则(Regularity)分布。拓扑关系•拓扑是定义空间关系的一种数学过程,是将空间关系量化的过程。常被解释为通过图论这一数学分支,用图表或图形来研究几何对象排列及其相互关系(Wilson和Watkins,1990)。拓扑是研究几何对象在弯曲或拉伸等变换下仍保持不变的性质(Massey,1967)。•简单地说,地理图形要素之间的各种关联、邻接以及包含等空间关系的总和就是拓扑关系(Topology)。(构成拓扑关系的)拓扑元素①拓扑线段(arc)②结点(node)③多边形(poly)该线段中间不与其它线段存在联系拓扑线段的两个端点,分别为首结点、尾结点由数条拓扑线段连接而成拓扑关系的种类拓扑邻接:N1/N2,N1/N3,N1/N4;P1/P3;P2/P3拓扑关联:N1/e1、e3、e6;P1/e1、e5、e6拓扑包含:P3与P4补充:欧拉公式体:拓扑元素量、顶点和面之间的关系:V+F-E=2(1)(2)(3)V=4F=4E=6V=8F=6E=12V=6F=8E=12V=9F=8E=15(4)复习题地理空间的概念?如何在地理空间中定位?在GIS中,如何表达地理空间实体?空间数据的拓扑关系?GIS中的拓扑关系的表达拓扑关系具体可由4个关系表来表示:(1)面—弧关系:(2)弧--结点关系:(3)结点—弧关系:(4)弧—面关系:面弧段弧两端的结点结点通过该结点的弧弧左面右面面与弧段的拓扑关系面域弧段P1a,b,c,-gP2b,d,fP3c,f,eP4g结点与弧段的拓扑关系结点弧段Aa,c,eBa,d,bCd,e,fDb,f,cEg弧段与结点的拓扑关系弧段结点aA,BbB,DcD,AdB,CeC,AfC,DgE,E弧段与面的拓扑关系弧段左邻面右邻面aP0P1bP2P1cP3P1dP0P2eP0P3fP3P2gP1基于拓扑的数据集需要增加数据文件来存储要素间的空间关系。数据集中构建拓扑关系有什么好处?•两个主要优势:•首先,是能确保数据质量。可用于发觉未正确接合的线、未正确闭合的多边形,以及数据地图上的其他数字化错误。比如最短路径分析需要道路正确相会,如果在假定连续的道路上存在一个缝隙,将会导致分析时避开缝隙而选择迂回路径。•其次,拓扑可强化GIS分析。比如交通容量分析中交通容量的测定是有方向性的。拓扑的重要性ESRI产品中采用的标准非拓扑数据格式称为Shapefile。它没有描述几何对象空间关系的文件。非拓扑数据有2个主要优势:首先非拓扑矢量数据能比拓扑数据更快速地在计算机屏幕上显示出来。第二,非拓扑数据具有非专有性和互操作性,意味着非拓扑数据可以在不同软件之间通用。ESRI产品中采用的标准拓扑数据格式有Coverage和Geodatabase模型(具有25种拓扑规则)。关于拓扑的决定取决于GIS项目需求。曲面数据模型(2.5维表达)曲面是指连续分布现象的覆盖表面,具有这种覆盖表面的要素有地形、降水量、温度和磁场等。表达和存储这些要素的基本要求是必须便于计算连续现象在任一点的数值。通常用如不规则三角网(triangulatedirregularnetwork,TIN)和规则格网(Grid)表达。全球温度图每隔22年黑子磁场TIN的基本组成要素包括点、线和面。点要素具有x,y(表示位置)和z值(表示海拔高度)的高程点。由构成三角形的三个点的x、y和z值可计算得每个三角形的坡度和坡向。根据这些不规则的采样高程点,用德老内(Delaunay)三角测量来构造初始的TIN,它是一个与其最近两个相邻点连接以尽可能形成等角三角形的反复过程(Watson和Philip,1984)。TIN曲面通常用于数字地形的三维建模和显示,可以方便地进行地形分析,如坡度和坡向信息的提取,填挖方计算,阴影和地形通视分析,等高线自动生成和三维显示等。三角形临近关系AB,EBA,CCB,DDC,EEA,D三角形节点A1,5,6B4,5,6C3,4,6D2,3,6E1,2,6毗连关系表数据文件节点坐标1X1,Y1,Z12X2,Y2,Z23X3,Y3,Z34X4,Y4,,Z45X5,Y5,Z56X6,Y6,Z6AEDCB165432三角形编号生成的TIN由三种几何对象组成:三角形(区域)、点(节点)和线(边界)。TIN数据结构包括三角形编号、每个毗连三角形的编号和数据文件,数据文件列表显示点、边界以及每个高程点的x,y和z值。日程栅格数据模型矢量数据与栅格数据的比较空间数据按其存储格式分为两类:矢量数据栅格数据栅格数据模型栅格数据模型用规则网格来覆盖整个空间,然后在各个格网单元内赋以空间对象相应颜色、符号、数字、灰度值的一种数据组织方式。实际就是像元阵列,每个像元由行列确定它的位置。由于栅格结构是按一定的规则排列的,行列坐标可以很容易地转为其它坐标系下的坐标。栅格结构表示的地表是不连续的,是量化和近似离散的数据。每一个单元格对应一个相应的地块。点面线点:为一个像元线:在一定方向上连接成串的像元集合。面:聚集在一起的像元集合思考划分研究区的网格除了正方形外,还可不可以是其他的规则形状?格网划多大合适?格网的属性如何确定?比如说格网内包含不止一个地理实体。栅格数据的表达可以有多种形状,但是在现实中一般为正方形各个栅格点大小一致像元大小:栅格点大小越小,分辨率越高(1)原则:应能有效地逼近空间对象的分布特征,又减少数据的冗余度。格网太大,忽略较小图斑,信息丢失。一般讲实体特征愈复杂,栅格尺寸越小,分辨率愈高,然而栅格数据量愈大计算机成本就越高,处理速度越慢。(2)方法:用保证最小多边形的精度标准来确定尺寸经验公式:h为栅格单元边长Ai为区域所有多边形的面积。是不是不管三七二十一,分辨率越高越好?栅格代码(像元值)的确定:当一个栅格单元内有多个可选属性值时,按一定方法来确定栅格属性值。1、中心点法:取位于栅格中心的属性值为该栅格的属性值2、面积占优法:栅格单元属性值为面积最大者。3、重要性法:定义属性类型的重要级别,取重要的属性值为栅格属性值,常用于有重要意义而面积较小的要素,特别是点、线地理要素。4、长度占优法:每个栅格单元的值由该栅格中线段最长的实体的属性来确定。栅格数据结构栅格矩阵结构链式编码(ChainCodes)游程编码结构四叉树数据结构八叉树数据结构十六叉树数据结构直接编码压缩编码栅格数据5,5A,A,B,B,BA,C,C,C,AD,C,C,A,AD,D,C,A,AD,D,A,A,AAABBBACCCADCCCADDCAADDAAA栅格矩阵编码就是将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记录代码。可以每行都从左到右逐个象元进行记录,也可以奇数行地从左到右而偶数行地从右向左记录,为了特定目的还可采用其他特殊的顺序。演示:使用ToolBox中工具转换成文本。游程长度编码所谓游程是指按行的顺序连续且属性值相同的若干栅格。游程长度的记录方式有两种:①记录每个游程起(迄)列号②记录每个游程象元数①逐行记录每个游程的迄点列号5,5A,2,B,5A,1,C,4,A,5D,1,C,3,A,5D,2,C,3,A,5D,2,A,5方式一:②记录每个游程象元数5,5A,2,B,3A,1,C,3,A,1D,1,C,2,A,2D,2,C,1,A,2D,2,A,3方式二(推荐):复习(判断)栅格数据模型使用的规则网格可以正方形,也可以是正三角形或正六边形。(简答)栅格数据的网格大小和文件存储量有什么关系?如何确定合适的网格大小?(简答)当一个网格单元内有多个可选属性值时,如何来确定栅格属性值?后页附图(问答)计算机中栅格数据结构存储类型有哪几种?请用栅格矩阵编码和游程编码方式表示下图中的栅格数据。AAABBAACCCDCCCADCCAADDAAA四叉树编码四叉树又称四元树或四分树,是最有效的栅格数据压缩编码方法之一。四分树将整个图像区域逐步分解为一系列方形区域,且每一个方形区域具有单一的属性。最小区域为一个象元。区域分割原则:将欲分解区域等分为四个象限,再根据各个象限的象元值是否单一决定要不要再分。如果单一则不再分割,否则同法再分,直到所有象限的象元属性值相同为止。MMRMMMMMMMRRMRMMMRRRRRRMMRRRRRRMMRRRRRRMMRRRRRRMMMRRRRRMMMMRRMMM1234567812345678区域分割方法MMRMMMMMMMRRMRMMMRRRRRRMMRRRRRRMMRRRRRRMMRRRRRRMMMRRRRRMMMMRRMMMNW(0)NE(3)SW(1)SE(2)在四叉树中,不能再分的结点称为叶子结点,可再分的结点称为树杈结点。四叉树编码方法“R”的四叉树编码(012,013,02,030,031,032)(102,103,120,122,123,13)(20,210,211,213,220,230,231)(302,31,320,321)复习题以下栅格数据结构的存储类型中,()属于非压缩存储。A、栅格矩阵B、游程编码C、四叉树D、八叉树简述四叉树编码的思路?根据下图画出四叉树并写出属性值M的编码。GIS中曲面的定义
本文标题:第二章 地理信息系统的数据结构
链接地址:https://www.777doc.com/doc-3250550 .html