您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据库 > 空间数据库复习思考题答案
《空间数据库》复习思考题1.空间数据库基本理论(6学时)2.Geodatabase概论(8学时)3.Geodatabase数据库设计与创建(6学时)4.Geodatabase数据存储及模式(6学时)5.Geodatabase版本、事务及分布式数据管理(16学时)6.ArcSDEGeodatabase配置及管理(6学时)2、阐述数据库系统的外部、内部体系结构。数据库系统外部体系结构单用户结构/主从式结构客户/服务器分布式结构B/S结构数据库系统内部体系结构数据库系统的三级模式结构外模式(ExternalSchema)模式(Schema)内模式(InternalSchema)模式(Schema)(1)模式(也称逻辑模式)a)数据库中全体数据的逻辑结构和特征的描述b)所有用户的公共数据视图,综合了所有用户的需求(2)一个数据库只有一个模式(3)模式的地位:是数据库系统模式结构的中间层a)与数据的物理存储细节和硬件环境无关b)与具体的应用程序、开发工具及高级程序设计语言无关(4)模式的定义a)数据的逻辑结构(数据项的名字、类型、取值范围等)b)数据之间的联系c)数据有关的安全性、完整性要求外模式(ExternalSchema)(1)外模式(也称子模式或用户模式)a)数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述b)数据库用户的数据视图,是与某一应用有关的数据的逻辑表示(2)外模式的地位:介于模式与应用之间(3)外模式的用途a)保证数据库安全性的一个有力措施b)每个用户只能看见和访问所对应的外模式中的数据(4)模式与外模式的关系:一对多a)外模式通常是模式的子集b)一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求c)对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同(5)外模式与应用的关系a)同一外模式也可以为某一用户的多个应用系统所使用b)但一个应用程序只能使用一个外模式内模式(InternalSchema)(1)内模式(也称存储模式)a)是数据物理结构和存储方式的描述b)是数据在数据库内部的表示方式i.记录的存储方式(顺序存储,按照B树结构存储,按hash方法存储)ii.索引的组织方式iii.数据是否压缩存储iv.数据是否加密v.数据存储记录结构的规定(2)一个数据库只有一个内模式数据库的二级映像功能与数据独立性三级模式是对数据的三个抽象级别二级映象在DBMS内部实现这三个抽象层次的联系和转换外模式/模式映像模式/内模式映像外模式/模式映象(1)模式:描述的是数据的全局逻辑结构(2)外模式:描述的是数据的局部逻辑结构(3)同一个模式可以有任意多个外模式(4)每一个外模式,数据库系统都有一个外模式/模式映象,定义外模式与模式之间的对应关系(5)映像定义通常包含在各自外模式的描述中(6)保证数据的逻辑独立性a)当模式改变时,数据库管理员修改有关的外模式/模式映象,使外模式保持不变b)应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。模式/内模式映象(1)模式/内模式映象定义了数据全局逻辑结构与存储结构之间的对应关系。(2)数据库中模式/内模式映象是唯一的(3)该映象定义通常包含在模式描述中(4)保证数据的物理独立性a)当数据库的存储结构改变了,数据库管理员修改模式/内模式映象,使模式保持不变;b)应用程序不受影响:保证了数据与程序的物理独立性,简称数据的物理独立性。3、什么是数据模型?阐述常用数据模型的基本思想。数据模型(DataModel)是数据特征的抽象,是数据库管理的教学形式框架。在数据库中用数据模型来抽象、表示和处理现实世界中的数据和信息。数据模型所描述的内容包括三个部分:数据结构、数据操作、数据约束。1)数据结构:数据模型中的数据结构主要描述数据的类型、内容、性质以及数据间的联系等。数据结构是数据模型的基础,数据操作和约束都建立在数据结构上。不同的数据结构具有不同的操作和约束。2)数据操作:数据模型中数据操作主要描述在相应的数据结构上的操作类型和操作方式。3)数据约束:数据模型中的数据约束主要描述数据结构内数据间的语法、词义联系、他们之间的制约和依存关系,以及数据动态变化的规则,以保证数据的正确、有效和相容。最常用的数据模型:关系模型层次模型(HierarchicalModel)网状模型(NetworkModel)半结构化模型(Semi-StructuredModel,如XML/GML模型)关系模型(RelationalModel)面向对象模型(ObjectOrientedModel)对象关系模型(ObjectRelationalModel)层次模型是用树形结构来表示实体及实体间联系的模型,它将数据组织成一对多的联系,即一个父记录对应多个子记录,而一个子记录只对应一个父记录。层次模型反映了现实世界中实体间的层次关系,层次结构是众多空间对象的自然表达形式,并在一定程度上支持数据的重构。但层次模型存在以下问题:①由于层次结构的严格限制,对任何对象的查询必须始于其所在层次结构的根,使得低层次对象的处理效率较低,并难以进行反向查询。数据的更新涉及许多指针,插入和删除操作也比较复杂。父结点的删除意味着其下属所有子结点均被删除,必须慎用删除操作。②层次模型不能表示多对多的联系。③在GIS中,若采用这种层次模型将难以顾及数据共享和实体间的拓扑关系,导致数据冗余度增加。网状模型是用网状结构来表示实体及实体间联系的模型,它将数据组织成多对多的联系。在此模型中,一个子记录可以有多个父记录。网状模型在一定程度上支持数据的重构,具有一定的数据独立性和共享特性,并且运行效率较高。但网状结构的复杂,增加了用户查询和定位的困难,它要求用户熟悉数据的逻辑结构,知道自身所处的位置。在基于矢量的GIS中,图形数据通常采用拓扑数据模型,这种模型非常类似于网络模型,但拓扑模型一般采用目标标识来代替网络联接的指针。关系模型是用二维关系来表示实体及实体间联系的模型,它将数据组织成规范化的关系表格。一个实体由若干关系组成,关系表的集合就构成了关系模型。关系模型中实体之间的联系不是用指针表示,而是由数据本身通过公共值隐含地表达,并且用关系代数和关系运算来操作。关系模型具有结构简单灵活,数据修改和更新方便、容易维护和理解等优点,是当前数据库中最常用的数据模型。关系数据库结构的最大优点是它的结构特别灵活,可满足所有用布尔逻辑运算和数学运算规则形成的询问要求;关系数据还能搜索、组合和比较不同类型的数据,加入和删除数据都非常方便。关系模型用于设计地理属性数据模型较为适宜。因为在目前,地理要素之间的相互联系是难以描述的,只能独立地建立多个关系表。关系数据库的缺点是,许多操作都要求在文件个顺序查找满足特定关系的数据,如果数据库很大的话,这一查找过程要花很多时间。因此搜索速度是犬系数据库的主要技术标准,也是建立关系数据库花费高的主要原因。面向对象模型(Object-OrientedModel)的基本思想就是以接近人类思维的方式将客观世界的一切实体或现象模型化为一系列对象。每一种对象都有各自的内部状态和行为,不同对象之间的相互联系和相互作用就构成了各种不同的面向对象系统。4、什么是空间索引?阐述格网索引、四叉树索引、R树索引的基本思想。空间索引是指依据空间对象的位置、形状以及空间对象之间的某种空间关系,按一定顺序排列的一种数据结构。其中包括空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针。空间索引,也叫空间访问方法(SpatialAccessMethodSAM),是指根据空间要素的地理位置、形状或空间对象之间的某种空间关系,按一定的顺序排列的一种数据结构,一般包括空间要素标识,外包络矩形以及指向空间要素的指针。这里,外包络矩形是指空间要素的封装边界,它是每一种空间索引必不可少的要素。空间索引的目的是为了在GIS系统中快速定位到所选中的空间要素,从而提高空间操作的速度和效率。空间索引的技术和方法是GIS关键技术之一,是快速、高效的查询、检索和显示地理空间数据的重要指标,它的优劣直接影响空间数据库和GIS系统的整体性能。空间索引性能的优劣直接影响空间数据库和地理信息系统的整体性能。常用的空间索引方法有:格网索引、四叉树索引和R-Tree索引。作为一种辅助性的空间数据结构,空间索引介于空间操作算法和空间对象之间,它通过筛选作用,大量与特定空间操作无关的空间对象被排除,从而提高了空间操作的速度和效率。空间索引性能的优劣直接影响空间数据库和地理信息系统的整体性能。空间索引的提出是由两方面决定的:其一是由于计算机的体系结构将存贮器分为内存、外存两种,访问这两种存储器一次所花费的时间一般为30~40ns,8~10ms,可以看出两者相差十万倍以上,空间数据一般存储在外部存储器,如果对外存上数据的位置不加以记录和组织,每查询一个数据项就要扫描整个数据文件,这种访问磁盘的代价就会严重影响系统的效率,因此系统的设计者必须将数据在磁盘上的位置加以记录和组织,通过在内存中的一些计算来取代对磁盘漫无目的的访问,才能提高系统的效率,尤其是GIS涉及的是各种海量的复杂数据,索引对于处理的效率是至关重要的。其二是由于多维空间数据不存在自然排序,使得传统的B树索引并不适用,因为B树所针对的字符、数字等传统数据类型都是在一个维度上,集合中任给两个元素,都可以在这个维度上确定其关系只可能是大于、小于、等于三种,若对多个字段进行索引,必须指定各个字段的优先级形成一个组合字段。而地理数据的多维性,在任何方向上并不存在优先级问题,因此B树并不能对地理数据进行有效的索引,所以需要研究特殊的能适应多维持性的空间索引方式。格网索引格网空间索引的基本思想是将研究区域按一定规则划分为大小相等或不等的网格,记录每一个网格所包含的地理对象。当用户进行空间查询时,首先计算出用户查询对象所在的格网,然后通过该格网快速查询所选的地理对象。四叉树索引四叉树是一种对空间进行规则递归分解的空间索引结构,将已知范围的空间划成四个相等的子空间。如果需要可以将每个或其中几个子空间继续划分下去,这样就形成了一个基于四叉树的空间划分。四叉树有两种,一种是线性四叉树,一种是层次四叉树,这两种四叉树都可以用来进行空间索引。对于线性四叉树而言,先采用编码(Peano键),然后,根据空间对象覆盖的范围,进行四叉树的分割。如图所示,空间对象E,它的最大最小范围,涉及到由叶节点0开始的4X4个节点,所以索引表的第一行,PeanoKeys=0,边长sidelength=4,空间对象的标识为E。空间对象D也有一条直线,它虽然仅通过0,2两个格网,但对线性四叉树来说,它涉及到0,1,2,3四个节点是不可再细分的,即它需要覆盖一个2*2的节点表达。同理,面状地物C也需要一个2*2的节点表达。对于点状地物,A、F、G一般可以用最末一级的节点进行索引。这样就建立了Peanokeys与空间目标的索引关系。当进行空间数据检索时,根据Peanokeys和边长就可以检索得到某一范围内的空间对象。层次四叉树的空间索引与线性四叉树基本类似。只是它需要记录中间节点和父节点到子节点之间的指针。除此之外,如果某个地物覆盖了哪一个中间节点,还要记录该空间对象的标识。如图4-3-2所示是图4-3-1的空间对象的层次四叉树索引。其中第一层根节点0涉及空间对象E,第二层的中间节点0涉及空间对象D,节点8涉及C,而A,F,G,B处于第三级叶节点。在这种索引中要注意,每个根节点、中间节点和叶节点都可能含有多个空间对象。这种四叉树索引方法实现和维护比较麻烦。0E0D48C121A4F13GB层1边长4层2边长2层3边长1R-Tree索引R-Tree是基于空间数据对象分割的空间索引方法,它采用空间对象的最小外包矩形MBR(MinimumBoundingRectangle)来近似表达空间对
本文标题:空间数据库复习思考题答案
链接地址:https://www.777doc.com/doc-4003958 .html