您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据库 > 20第二部分 空间数据库设计与实现(1)
第二部分空间数据库设计与实现主要内容•复习空间数据库相关概念•空间数据库ER模型设计方法•空间数据库UML模型设计方法•Geodatabase面向对象空间数据库设计与应用第一节空间数据库相关概念•空间数据?•空间数据模型?•空间数据结构?•空间数据库?•空间数据库管理?•地理空间元数据?2D空间数据•数据:在计算科学中数据是指输入到计算机中被计算即程序处理的符号的总称。•空间数据:指用来表示空间实体的位置、形状、大小及其分布特征诸多方面信息的数据•以点、线、面等方式,采用编码技术描述空间物体特征、动态变化及相互关系的数据集。空间数据特征•一个物体空间特征可从三方面进行描述:位置信息、属性信息和时间信息。•位置信息:用定位数据来记录,它反映自然现象的地理分布,具有定位的性质;•属性信息:用属性数据来记录,它描述自然现象、物体的质量和数量特征等;•时间信息:是空间物体存在形式之一,无论是空间数据还是属性数据,都是在某一时刻采集的空间信息。空间数据模型•模型:是对现实世界的认识和理解,是对客观现实系统的近似描述,特别是对客观事物中一些要研究的特征、结构或属性及其变化规律的抽象描述。•数据模型:实际上是通过数据手段对现实世界进行的抽象描述。空间数据模型:•是关于现实世界中空间实体及其相互关系的概念;•是用计算机能够识别和处理的形式化语言来定义和描述现实世界的地理实体、地理现象及其相互关系;•是现实世界到计算机世界的直接影射;•为空间数据的组织和设计空间数据库模式提供了基本方法。空间数据结构•数据结构:是计算机存储、组织数据的方式。•空间数据结构:是指对空间数据进行合理的组织,以进行计算机处理。空间数据模型与空间数据结构区别•数据结构是数据模型和文件格式之间的中间媒介,数据模型与数据结构之间没有严格区别,数据模型是数据表达的概念模型,数据结构是数据表达的物理实现。•空间数据模型通过一定的数学方法,把空间实体提炼成模型,而空间数据结构是在空间数据模型的基础上发展起来的,是一种软件常规的内涵,通过计算机的编码理论、存取方式以及各数据单元在计算机组织、存贮中的分配来实现•前者是后者的基础,后者是前者的实现。•现实空间对象的计算机表达是用合适的空间数据模型描述空间对象的关系,然后用合适的数据结构表达空间对象的三大特征。空间数据库•数据库(Database):其意义为数据基地。即依照某种数据模型组织起来并统一存贮和集中管理数据的数据集合。•空间数据库(SpatialDatabase):是以依照某种空间数据模型来描述地理空间位置和点、线、面、体特征的位置数据(空间数据)以及描述这些特征的属性数据(非空间数据)为对象的数据库。层次数据模型•层次数据模型是将数据组织成一对多(或双亲与子女)关系的结构。•特点:(1)有且仅有一个结点无双亲,这个结点即树的根;(2)其它结点有且仅有一个双亲。层次数据模型示例层次数据模型优缺点•数据模型的优点是层次和关系清楚,检索路线明确。•层次模型将难以顾及公共点,线数据共享和实体元素间的拓扑关系,导致数据冗余度增加,而且给拓扑查询带来困难。网络数据模型•在网络模型中,各记录类型间可具有任意连接的联系。一个子结点可有多个父结点;可有一个以上的结点无父特点;父结点与某个子结点记录之间可以有多种联系(一对多、多对一、多对多)。网络数据模型示例网络数据模型的优缺点•缺点:由于数据间联系要通过指针表示,指针数据项的存在使数据量大大增加,当数据间关系复杂时指针部分会占大量数据库存贮空间。另外,修改数据库中的数据,指针也必须随着变化。因此,网络数据库中指针的建立和维护可能成为相当大的额外负担。关系型数据模型•关系模型的基本思想是用二维表形式表示实体及其联系。•实体间联系和各二维表间联系采用关系描述或通过关系直接运算建立。关系型数据模型优缺点•优点:它的结构特别灵活,可满足所有用布尔逻辑运算和数学运算规则形成的询问要求;关系数据还能搜索、组合和比较不同类型的数据,加入和删除数据都非常方便。•缺点:许多操作都要求在文件中顺序查找满足特定关系的数据,如果数据库很大的话,这一查找过程要花很多时间。面向对象数据模型•核心是对象和类;•类:•对象:•分类:•概括:•联合:•聚集:•继承:空间数据结构•矢量数据结构•栅格数据结构•矢-栅一体数据结构两类结构都可用来描述地理实体的点、线、面三种基本类型。矢量数据结构矢量数据结构:是通过记录空间对象的坐标及空间关系来表达空间对象的位置,以点、线和面等形式来表示地理实体。点:空间的一个坐标点;线:多个点组成的弧段;面:多个弧段组成的封闭多边形;矢量数据结构类型按其是否明确表示地理空间相互关系可分为,•实体型数据结构•拓扑型数据结构实体型数据结构实体型数据结构:只记录空间对象的位置坐标和属性信息,不记录拓扑关系,又称面条结构。•存储方式:索引式编码:点坐标独立存储,线、面由点号组成;实体式编码:空间对象位置直接跟随空间对象;实体型数据结构存储标识码属性码标识码是系统对空间对象的排列序号唯一性连接空间和属性数据数据库实体式编码点:(x,y)线:(x1,y1),(x2,y2),…,(xn,yn)面:(x1,y1),(x2,y2),…,(x1,y1)索引式编码点:点号文件线:点号串面:点号串点号XY1112223344………n5566空间位置实体式数据编码示例12345678910111213141516171819202122232425262728293031多边形存储数据信息A(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),(x6,y6),(x7,y7),(x8,y8),(x9,y9),(x1,y1)B(x1,y1),(x9,y9),(x8,y8),(x17,y17),(x16,y16),(x15,y15),(x14,y14),(x13,y13),(x12,y12),(x11,y11),(x10,y10),(x1,y1)C(x24,y24),(x25,y25),(x26,y26),(x27,y27),(x28,y28),(x29,y29),(x30,y30),(x31,y31),(x24,y24)D(x19,y19),(x20,y20),(x21,y21),(x22,y22),(x23,y23),(x15,y15),(x16,y16),(x19,y19)E(x5,y5),(x18,y18),(x19,y19),(x16,y16),(x17,y17),(x8,y8),(x7,y7),(x6,y6),(x5,y5)索引式编码示例1、点文件:索引文件:3、面文件:2、弧段文件:点号坐标1x1,y1弧段号起点终点点号A527,8,9,10面号弧段号P1A,B,C实体型数据结构特点•优点:文件结构简单,易于实现以多边形为单位的运算和显示。•缺点:z多边形之间的公共边界被数字化和存储两次,由此产生冗余和碎屑多边形;z每个多边形自成体系而缺少邻域信息,难以进行邻域处理,如消除某两个多边形之间的共同边界;z岛(湖)只作为一个单个的图形建造,没有与外包多边形的联系;z无拓扑数据,相互之间不关联,不易检查拓扑错误。•适用范围:制图及一般查询,不适合复杂的空间分析。拓扑型数据结构拓扑结构:是明确定义空间结构关系的一种数学方法。在GIS中,为了真实反映地物,不仅包括实体的大小、形状及属性,而且要反映出实体之间的相互关系。例如,交通网、管网等,都存在结点、弧段和多边形之间的拓扑关系。•存储方式:双重独立式编码;链状双重独立式编码;拓扑邻接:同类元素之间的拓扑关系。拓扑关联:不同类元素之间的拓扑关系。拓扑包含:同类不同级元素之间的拓扑关系。空间数据的拓扑关系N1e1e2e5e6e4e7e3P1P3P2P4N4N3N5N2拓扑邻接:N1/N2,N1/N3,N1/N4;P1/P3;P2/P3拓扑关联:N1/е1、е3、е6;P1/е1、е5、е6拓扑包含:P3与P4拓扑关系示例双重独立式编码•简称DIME(DualIndependentMapEncoding),是美国人口统计系统采用的一种编码方式,是一种拓扑编码结构;1、点文件点号坐标1x1,y12、线文件:线文件是以线段为记录单位线号左多边形右多边形起点终点L210P1P22103、面文件面号线号P1L210,L109…关联邻接关联连通拓扑关系明确链状双重独立式编码链状双重独立式数据结构是DIME数据结构的一种改进。在DIME中,一条边只能用直线两端点的序号及相邻的面域来表示,而在链状数据结构中,将若干直线段合为一个弧段(或链段),每个弧段可以有许多中间点。在链状双重独立数据结构中,主要有四个文件:多边形文件、弧段文件、弧段坐标文件、结点文件。链状双重独立式编码四个文件1、弧段坐标文件:弧段号坐标系列(串)Ax2,y2,X10,y10…2、弧段文件:链—面,链—结点关系弧段号左多边形右多边形起点终点AP1P2253、多边形文件多边形号弧段号P1A,B,-C4、点拓扑文件:结点—链关系点号弧段号2A,B,D拓扑型数据结构优缺点优点:•描述点、线、面的空间关系不完全依赖于具体坐标位置;•用拓扑表所表达的空间关系信息丰富、简洁,若采用其他办法会出现大量的重复数据(冗余);•便于作多边形和多边形的叠合;•便于检查数据输入过程中的错误。缺点:•拓扑关系的建立比较复杂;•数据结构本身比较复杂。第二节栅格数据结构•栅格数据模型以一定方式把整个空间区域分成若干规则的格网区(通常是正方形、三角形、正六边形)。格网的大小是预先设好的,每个栅格的大小代表定义的空间分辨率。•地理实体的位置用它们占据的栅格行、列号来定义。栅格(网格)的大小取决于所需空间信息的精度,栅格的值代表该位置的状态。=0=1=2=3点线面栅格结构数据表达栅格结构数据示例栅格属性值确定实际应用中,每个网格通常会有不同的几种属性值,由于只能取一种,这就有不同的取值方法。(1)中心点法。即用处于栅格中心点的地物类或现象特性决定栅格的值。有时也称为网格交点归属法。(2)面积占优法,就是以占栅格最大的地物类或现象特征决定栅格单元的值。(3)长度最占优法。当覆盖的网格过中心部位时,横线占据该格中的大部分长度的属性值定为栅格单元的值。(4)重要性法。根据栅格内不同地物的重要性,选取最重要的地物类型决定相应的栅格单元的值。如重要性依次为C,A,E,B和D。栅格数据编码•直接栅格编码•行程编码(变长编码)•块码(游程编码向二维扩展)•链式编码、Freeman链码、边界链码•四叉树编码空间数据库管理系统•文件方式•全关系型数据库管理方式•对象——关系数据库管理方式•使用面向对象的数据库管理系统(OODBMS)来统一存放和管理空间数据和属性数据空间数据设计过程物理设计外部设计概念设计逻辑设计数据字典数据对象图数据模型数据库实体阶段:成果:外部设计•外部设计是一个起始阶段,即数据的规划和分析阶段。由于海底观测数据涉及专业面广、类型复杂,难以将全部的信息进行建模,因此首先需要根据实际应用需求将海底观测网络数据对象进行分析和简化,从而获取现有用户以及未来用户的数据要求。•外部设计的关键任务是找出数据中公有的、核心的对象,得到的结果通常是用来描述数据对象内容的数据字典。概念设计•概念设计阶段主要任务是构建数据模型来表达海底观测数据对象的结构特征和相互关系。基于外部设计的结果,概念设计运用建模语言(UML)分析和表达数据对象的空间、时间和属性特征。逻辑设计•在逻辑设计阶段,概念对象模型向数据管理系统所支持的关系模式进行映射,被转换成能够被数据库系统直接生成的关系模式。通常情况下,每一个对象类或关联分别转换成一个图层或数据表以及关系类。Visio中空间要素类UML类图物理设计•解决数据库应用在计算机中具体实现时方方面面细节。有关存储、索引和内存管理等问题都在这一阶段考虑和解决数据库逻辑模型地理空间元数据•元数据(Metadata):关于数据的数据,•地理空间元数据:是关于地理相关数据和信息资源的描述信息,是用于描述地理数
本文标题:20第二部分 空间数据库设计与实现(1)
链接地址:https://www.777doc.com/doc-5962662 .html