您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据结构与算法 > 第六章 空间数据管理
空间数据管理本章首先介绍空间数据库、与一般数据库的比较,以及空间数据库的存储方式。然后介绍了GIS中两种重要的数据结构:栅格结构和矢量结构,以及其具体的存储方式,然后比较了两种结构的特点,并给出了其相互转换算法。最后介绍了空间检索中常用的技术——空间索引,介绍了一些常用的空间索引方式,如BSP树、R树、CELL树等;以及空间数据的查询功能。1.空间数据库1.1地理信息系统与一般管理信息系统的比较(一)两者区别1)在硬件上,为了处理图形和图像数据,系统需要配置专门的输入和输出设备,如数字化仪、绘图机、图形图像的显示设备等;许多野外实地采集和台站的观测所得到的资源信息是模拟量形式,系统还需要配置模——数转换设备,这些设备往往超过中央处理机的价格,体积也比较大。2)在软件上,则要求研制专门的图形和图像数据的分析算法和处理软件,这些算法和软件又直接和数据的结构及数据库的管理方法有关。1.空间数据库1.1地理信息系统与一般管理信息系统的比较3)在信息处理的内容和采用目的方面,一般的管理信息系统,主要是查询检索和统计分析,处理的结果,大多是制成某种规定格式的表格数据,而地理信息系统,除了基本的信息检索和统计分析外,主要用于分析研究资源的合理开发利用,制定区域发展规划,地区的综合治理方案,对环境进行动态的监视和预测预报,为国民经济建设中的决策提供科学依据,为生产实践提供信息和指导。1.空间数据库1.1地理信息系统与一般管理信息系统的比较(二)两者共同处两者都是以计算机为核心的信息处理系统,都具有数据量大和数据之间关系复杂的特点,也都随着数据库技术的发展在不断的改进和完善。比较起来,商用的管理信息系统发展快,用户数量大,而且已有定型的软件产品可供选用,这也促进了软件系统的标准化。地理信息系统,由于上述一些特点,多是根据具体的应用要求专门设计,数据格式和组织管理方法各不相同。1.空间数据库1.2空间数据库(一)数据库概念数据库就是为一定目的服务,以特定的数据存储的相关联的数据集合,它是数据管理的高级阶段,是从文件管理系统发展而来的。地理信息系统的数据库(简称空间数据库或地理数据库)是某一区域内关于一定地理要素特征的数据集合。数据库图书馆数据图书数据模型书卡编目数据的物理组织图书存放规则、书架数据库管理系统图书管理员外存书库用户读者数据存取图书借阅1.空间数据库1.2空间数据库(一)空间数据库特点数据量特别大;不仅有地理要素的属性数据(与一般数据库中的数据性质相似),还有大量的空间数据;数据应用广泛;1.空间数据库1.2空间数据库(三)数据库管理系统数据库管理系统(DatabaseManagementSystem,DBMS)是在文件处理系统的基础上进一步发展的系统。DBMS在用户应用程序和数据文件之间起到了桥梁作用。DBMS的最大优点是提供了两者之间的数据独立性,即应用程序访问数据文件时,不必知道数据文件的物理存储结构。当数据文件的存储结构改变时,不必改变应用程序。1.空间数据库1.2空间数据库1)采用标准DBMS存储空间数据的主要问题GIS中空间数据记录是变长的,且要存储和维护空间数据拓扑关系;DBMS一般都难以实现对空间数据的关联、连通、包含、叠加等基本操作。GIS需要一些复杂的图形功能,一般的DBMS不能支持;地理信息是复杂的,单个地理实体的表达需要多个文件、多条记录、或许包括大地网、特征坐标、拓扑关系、空间特征量测值、属性数据的关键字以及非空间专题属性等;具有高度内部联系的GIS数据记录需要更复杂的安全性维护系统。1.空间数据库1.2空间数据库2)GIS数据管理方法主要4种类型①对不同的应用模型开发独立的数据管理服务,这是一种基于文件管理的处理方法。②在商业化的DBMS基础上开发附加系统。开发一个附加软件用于存储和管理空间数据和空间分析,使用DBMS管理属性数据。③使用现有的DBMS,通常是以DBMS为核心,对系统的功能进行必要扩充,空间数据和属性数据在同一个DBMS管理之下。需要增加足够数量的软件和功能来提供空间功能和图形显示功能。④重新设计一个具有空间数据和属性数据管理和分析功能的数据库系统。1.空间数据库1.3数据与文件组织(一)数据组织分级数据项数据项是可以定义数据的最小单位,也叫元素、基本项、字段等,数据项与现实世界实体的属性相对应,数据项有一定的取值范围,称为域,域以外的任何值对该数据项都是无意义的。记录记录是由若干相关联的数据项组成,是处理和存储信息的基本单位,是关于一个实体的数据总和,构成该记录的数据项表示实体的若干属性。为了唯一标识每个记录,就必须有记录标识符,也叫关键字。记录标识符一般由记录中的第一个数据项担任,唯一标识记录的关键字称主关键字,其它标识记录的关键字称为辅关键字。1.空间数据库1.3数据与文件组织文件文件是一给定类型的(逻辑)记录的全部具体值的集合,文件用文件名称标识,文件根据记录的组织方式和存取方法可以分为:顺序文件、索引文件、直接文件和倒排文件等。数据库数据库是比文件更大的数据组织,数据库是具有特定联系的数据的集合,也可以看成是具有特定联系的多种类型的记录的集合。数据库的内部构造是文件的集合,这些文件之间存在某种联系,不能孤立存在。1.空间数据库1.3数据与文件组织(二)数据间的逻辑联系数据间的逻辑联系主要是指记录与记录之间的联系。记录是表示现实世界中的实体的。实体之间存在着一种或多种联系,这样的联系必然要反映到记录之间的联系上来。数据之间的逻辑联系主要有三种:一对一的联系;一对多的联系;多对多的联系。1.空间数据库1.3数据与文件组织(三)常用数据文件文件组织主要指数据记录在外存设备上的组织,它由操作系统OS进行管理,具体讲在外存设备上如何安排数据和组织数据,以及实施对数据的访问方式等问题。操作系统实现的文件组织方式,可以分为顺序文件、索引文件、直接文件和倒排文件。1.空间数据库1.3数据与文件组织顺序文件是最简单的文件组织形式,对记录按照主关键字的顺序进行组织。索引文件索引文件除了存储记录本身(主文件)以外,还建立了若干索引表,这种带有索引表的文件叫索引文件。索引表中列出记录关键字和记录在文件中的位置(地址)。1.空间数据库1.3数据与文件组织直接文件直接文件又称随机文件,其存储是根据记录关键字的值,通过某种转换方法得到一个物理存储位置,然后把记录存储在该位置上。查找时,通过同样的转换方法,可以直接得到所需要的记录。倒排文件倒排文件是带有辅索引的文件,其中辅索引是按照一些辅关键字来组织索引的。倒排文件的主要优点是在处理多索引检索时,可以在辅检索中先完成查询的‘交’、‘并’等逻辑运算,得到结果后再对记录进行存取,从而提高查找速度。1.空间数据库1.4矢量和栅格数据结构矢量数据模型在矢量模型中,现实世界的要素位置和范围可以采用点、线或面表达,与它们在地图上表示相似,每一个实体的位置是用它们在坐标参考系统中的空间位置(坐标)定义。栅格数据模型在栅格模型中,空间被规则地划分为栅格(通常为正方形)。地理实体的位置和状态是用它们占据的栅格的行、列来定义的。每个栅格的大小代表了定义的空间分辨率。1.空间数据库1.4矢量和栅格数据结构1.空间数据库1.4矢量和栅格数据结构2.栅格数据结构及其编码2.1栅格数据结构(一)定义栅格结构是最简单最直接的空间数据结构,是指将地球表面划分为大小均匀紧密相邻的网格阵列,每个网格作为一个象元或象素由行、列定义,并包含一个代码表示该象素的属性类型或量值,或仅仅包括指向其属性记录的指针。点用一个栅格单元表示;线状地物沿线走向的一组相邻栅格单元表示,每个栅格单元最多只有两个相邻单元在线上;面或区域用记有区域属性的相邻栅格单元的集合表示,每个栅格单元可有多于两个的相邻单元同属一个区域。2.栅格数据结构及其编码2.1栅格数据结构000000000000000000002000000000000000000000000000000000000000000000000600000000000066600000000006000000000006000600000060000000000744444477774777444487780840877808800800887888880000888800000888(a)点(b)线(c)面2.栅格数据结构及其编码2.1栅格数据结构(二)特点栅格结构的显著特点是:属性明显;定位隐含;易于存储;算法简单;地表是不连续,是量化和近似离散的数据。2.栅格数据结构及其编码2.2决定栅格单元代码的方法在决定栅格代码时尽量保持地表的真实性,保证最大的信息容量。图7-5所示的一块矩形地表区域,内部含有A、B、C三种地物类型,O点为中心点,将这个矩形区域近似地表示为栅格结构中的一个栅格单元时,可根据需要,采取如下的方式之一来决定栅格单元的代码。2.栅格数据结构及其编码2.2决定栅格单元代码的方法中心点法用处于栅格中心处的地物类型或现象特性决定栅格代码,在图7-5所示的矩形区域中,中心点O落在代码为C的地物范围内,按中心点法的规则,该矩形区域相应的栅格单元代码为C,中心点法常用于具有连续分布特性的地理要素,如降雨量分布、人口密度图等。面积占优法以占矩形区域面积最大的地物类型或现象特性决定栅格单元的代码,在图7-5所示的例子中,显见B类地物所占面积最大,故相应栅格代码定为B。面积占优法常用于分类较细,地物类别斑块较小的情况。2.栅格数据结构及其编码2.2决定栅格单元代码的方法重要性法根据栅格内不同地物的重要性,选取最重要的地物类型决定相应的栅格单元代码,假设图7-5中A类最重要的地物类型,即A比B和C类更为重要,则栅格单元的代码应为A。重要性法常用于具有特殊意义而面积较小的地理要素,特别是点、线状地理要素,如城镇、交通枢纽、交通线、河流水系等,在栅格中代码应尽量表示这些重要地物。百分比法(长度占优法)根据矩形区域内各地理要素所占面积的百分比数确定栅格单元的代码,如可记面积最大的两类BA,也可以根据B类和A类所占面积百分比数在代码中加入数字2.栅格数据结构及其编码2.3编码方法(一)直接栅格编码这是最简单直观而又非常重要的一种栅格结构编码方法,通常称这种编码的图像文件为网格文件或栅格文件,栅格结构不论采用何种压缩编码方法,其逻辑原型都是直接编码网格文件。直接编码就是将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记录代码,可以每行都从左到右逐个象元记录,也可以奇数行地从左到右而偶数行地从右向左记录,为了特定目的还可采用其他特殊的顺序。AAAAABBBAABBAABB2.栅格数据结构及其编码2.3编码方法2.栅格数据结构及其编码2.3编码方法(二)压缩编码方法目前有一系列栅格数据压缩编码方法,如链码、游程长度编码、块码和四叉树编码等。其目的,就是用尽可能少的数据量记录尽可能多的信息,其类型又有信息无损编码和信息有损编码之分。信息无损编码是指编码过程中没有任何信息损失,通过解码操作可以完全恢复原来的信息,信息有损编码是指为了提高编码效率,最大限度地压缩数据,在压缩过程中损失一部分相对不太重要的信息,解码时这部分难以恢复。在地理信息系统中多采用信息无损编码,而对原始遥感影像进行压缩编码时,有时也采取有损压缩编码方法。2.栅格数据结构及其编码2.3编码方法链码链码又称为弗里曼链码[Freeman]或边界链码,链码可以有效地压缩栅格数据,而且对于估算面积、长度、转折方向的凹凸度等运算十分方便,比较适合于存储图形数据。缺点是对边界进行合并和插入等修改编辑工作比较困难,对局部的修改将改变整体结构,效率较低37650p412(a)(b)012345(3,0)211000665672.栅格数据结构及其编码2.3编码方法游程长度编码地理数据往往有较强的相关性,也就是说相邻像元的值往往是相同的。游程长度编码的基本思想是:按行或列扫描,将相邻等值的像元合并,并记录代码的重复个数。其方法有两种方案:一种编码方案是,只
本文标题:第六章 空间数据管理
链接地址:https://www.777doc.com/doc-7032400 .html