您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据库 > 空间数据库整理部分资料
空间数据库与关系数据库间的主要区别:1)和关系数据库相比,空间数据库没有固定的运算符集合2)空间数据库处理对象复杂,具有空间范围,不能自然按一维排序检测空间谓词需要用到大量复杂计算,所以CPU的代价不是主要由I/O决定5、空间查询处理的“过滤——精炼模式”是什么?其目的?目的:用两步走算法高效的处理复杂的数据模型过滤:寻找Q最终结果的超集S;精炼:利用GIS处理S来找到精确的Q的答案E-R图空间模型,除了属性信息,通过象形图扩展…6、象形图:象形图是一种将对象插在方框内的微缩图表示,这些微缩图用来扩展ER图,并插到实体矩形框中的适当位置6.1、对于空间数据,ER模型方法的不足之处?为表达空间概念,扩展ER模型主要增加了哪些要素?--实体象形图、关系象形图,读懂扩展ER模型的表示符号。(书上P51)答:1)、ER模型的最初设计隐含了基于对象模型的假设。因此,场模型无法用ER模型进行自然的映射2)、在传统的ER模型中,实体之间的联系由所要开发的应用来导出,而在空间建模中,空间对象之间总会有内在的联系3)、建模空间对象所使用联系类型和“地图”的比例尺有关6.2、举例说明用象形符号扩展ER图,对于空间数据建模有何好处?用象形符号扩展ER图,以便专门处理空间数据类型。这将减少ER图以及所产生的关系模式的复杂度,同时改进空间建模的质量。空间联系(例如Road-Crosses-River)就可以从ER图中省略,用隐式的方式表示。关系模式中的表达多值空间属性的关系和M:N空间联系也就不需要了空间索引的基本思想7、空间索引:是指根据空间对象的位置和形状或空间对象之间的某种空间关系按一定的顺序排列的一种数据结构,其中包含空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针;空间索引技术包括R树索引、四叉树索引、网格索引等空间索引文件:是用来提高空间数据查询效率的辅助文件。索引文件的记录只有两个域,即码域和空间数据的页面地址主索引,如果数据文件的记录是按照主码排列的,那么索引就只需要保存数据文件的每个磁盘页面第一个主码域值。每个索引记录一个数据页面。二级索引:堆数据文件,一个索引记录一个数据。一个磁盘最多只有一个主索引,因为主索引决定了数据在磁盘上的存储顺序空间索引方法:1)在系统中加入专门的外部空间数据结构,为空间属性提供如同B树之于线性属性的功能。2)使用空间填充曲线(如Z序、Hilbert曲线)将空间对象映射到一维空间,以便空间对象存储在标准的一维索引(例如B树)中。13、空间查询:利用空间索引机制,从数据库中找出符合该条件的空间数据。包括几何查询、属性查询和时态查询等点查询:数据未排列且没有索引:穷举法,扫描整个文件并判断每条记录是否满足谓语建立空间索引:在索引中使用find操作;需要查找的磁盘扇区等于索引的深度空间填充曲线散列:运用折半法寻找点;检验大约logB(n),的磁盘扇区区域查询:数据未排列且没有索引:穷举法,扫描整个文件并判断每条记录是否满足谓语建立空间索引:在索引中使用范围查询操作空间填充曲线散列:验证Z值满足范围查询要求;使用折半查询找到最低的Z值;扫描前面的数据文件直至满足查询要求的最大的Z值空间连接:嵌套循环,检验所有可能的空间谓语对;基于空间分块,只检验普通空间区域的对象对树匹配:从每张表中找出分层的的对象组1、查询语言与查询树之间的互换?语法分析器执行2、对查询树进行逻辑转换的目的和一般方法是什么?答:方法:将非空间的选择和投影操作下推目的:减少连接操作所涉及的关系大小,从而减少计算代价。空间聚集:(最近领域)即给定一个对象O’,找出所有距离O’最近的对象O。空间聚集通常是“最近邻居”搜索的变体R树12、R树:R树是一种利用B树的某些本质特征来处理多维数据的数据结构,是B树在多维上的自然扩展,也是平衡树。R树中用对象的最小外包矩形(MBR)来表示对象;R树中每个非叶子结点都由若干个(p,MBR)数据对组成。MBR为包含其对应孩子的最小边界矩形,p是指向其对应孩子结点的指针。叶子结点则是由若干个(OI,MBR)组成,OI是空间对象的标号R树的其它特点1.1除根结点外,每个结点包含m~M条索引记录(其中m﹤﹦M/2;1.2除根结点外,每个中间结点至多M个子结点,至少有m个子结点;1.3若根结点不是叶结点,则至少包含2个子结点;1.4所有叶结点出现在同一层;1.5所有MBR的边与一个全局坐标系的坐标轴平行;R+树:R+树索引的主要特征是在R+树中兄弟节点对应的空间区域没有重叠,这样划分空间可以使空间搜索的效率提高。11、平面扫描(planesweep)技术主要解决什么问题?其主要步骤?答:主要解决的是如何在过滤阶段中尽可能多的淘汰不符合条件的对,从而减少几何计算的计算代价。Step1:从左至右移动一条扫描线(例如,垂直于x轴的线),停在R∪S的第一个元素处。这就是具有最小T.xl值的矩形T,例子为是矩形R4。Step2:搜索S中已排序的矩形,直到抵达第一个矩形Sf,这里有Sf.xlT.xu。显然,对于所有1≤jf,关系[T.xl,T.xu]∩[Sj.xl,Sj.xu]存在(非空),在本例中Sf就是S1。注意f是以图1-9c的数组索引为序,即S1=S2、S2=S1、S3=S3。这样S2就是一个可能与R4交叠的候选矩形。Step3:如果对任意l≤j≤f,关系[T.yl,T.yu]∩[Sj.yl,Sj.yu]存在,则Sj与T相交。因此,这一步就确定了R4与S2的确是交叠的,并且R4,S2是连接结果的一部分。记录所有这样的信息,然后将矩形T(R4)从集合R∪S中去掉,它不再需要参与结果集中的其他相交对。Step4:继续移动扫描线来穿过集合R∪S,直至碰到下一个矩形,在本例中是S2。这时进行步骤2和3。Step5:当R∪S=∅时,处理结束;4、磁盘存储相关概念:磁道track、扇区sector、柱面cylinder?页面的概念?答:磁道:圆心磁盘片上向边缘延伸的同心圆扇区:每个磁道中被分成若干等份的区域柱面:是磁盘上具有相同镭的磁道的集合页面:又称磁盘块。是磁盘与主存之间的最小传输单位5、访问磁盘扇区数据的过程,哪个过程花费的时间最多?•Seek(寻道):Moveheadassemblytorelevanttrack(ts)•磁头到达特定磁道所用的时间•Latency(延迟时间):Waitforspindletorotaterelevantsectorunderdiskhead(tl)块旋转到磁头下方所用的时间•Transfer传输时间:Readorwritethesector(tt)置于正确位置后读写块中数据的实际时间•123聚类:聚类的目的就是降低响应常见的大查询的寻道时间(ts)和等待时间(t1)。对于空间数据库来说,这意味着在二级存储中,空间上相邻的和查询上有关联性的对象在物理上应当存储在一起。1、数据库:就是为了一定的目的,在计算机系统中以特定的结构组织、存储、管理和应用的相关联的数据集合,是数据管理的高级阶段。空间数据库是存取、管理空间信息的数据库,指的是地理信息系统在计算机物理存储介质上存储的应用相关的地理空间数据的总和,一般是以一系列特定结构的文件的形式组织在存储介质之上的空间数据库与关系数据库间的主要区别:3)和关系数据库相比,空间数据库没有固定的运算符集合4)空间数据库处理对象复杂,具有空间范围,不能自然按一维排序5)检测空间谓词需要用到大量复杂计算,所以CPU的代价不是主要由I/O决定空间数据模型:是关于现实世界中空间实体及其相互联系的概念,它为描述空间数据的组织和设计空间数据库模式提供着基本方法空间数据库管理系统:1)一个SDBMS是一个软件模块,它利用一个底层数据库管理系统2)SDBMS支持多种空间数据模型、相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言3)SDBMS支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规则空间信息:也就是指在某个空间框架(如地球表面)中的位置信息。空间信息是指与研究对象的空间地理分布有关的信息,它表示地理系统诸多要素的数量、质量、分布特征,相互联系和变化规律的图、文、声、像等的总称地理信息系统:是用于采集、模拟、处理、检索、分析和表达地理空间数据的计算机信息系统,可以作为ADBMS的前端数据模型:数据模型是一条或一组用于标识和表示空间参照对象的规则,数据模型是数据集的特定结构和模式,是对数据的文件描述,有利于某些性质的前期分析。数据模型是数据库系统中关于数据内容和数据之间联系的逻辑组织的形式表示。每一个具体的数据库都是由一个相应的数据模型来定义。层次模型、网络模型、关系模型、面向对象模型对象模型:对象模型很适合表示有固定形状的空间实体场模型:用于表示连续的或无固定形状的概念2、数据库的发展:(图)数据库系统的前身为文件系统,数据库技术最初产生于20世纪60年代中期,根据数据模型的发展,可以划分为三个阶段:第一代的网状、层次数据库系统;第二代的关系数据库系统;第三代的以面向对象模型为主要特征的关系数据库系统3、场操作可以分为三类:局部操作、聚焦操作、区域操作局部操作:空间框架内一点给定位置的新场的取值只依赖于同一位置场的输入值聚焦操作:在指定位置的结果场的值依赖于同一位置的一个假定小领域输入场的值区域操作:与聚集运算符或微积分中的积分运算有关,如森林的例子中计算每个树种的平均高度4、数据库设计的三个步骤:首先,采用高层次的概念数据模型来组织所有与应用相关的可用信息:重点关注应用的数据类型及其联系和约束,设计过程的这个阶段不考虑具体实现细节。概念模型通常用浅显的文字,结合简单一致的图形符号来表示。实体-联系模型是所有概念设计工具中最为流行的一种;然后,逻辑建模阶段,与概念数据模型在商用DBMS上的具体实现有关;最后,数据库设计的第三步骤是物理设计的建模,它解决了数据库应用在计算机中具体实现时方方面面的细节5、概念模型:是对真实世界中问题域内的事物的描述,不是对软件设计的描述。E-R模型表示逻辑模型:是指数据的逻辑结构。关系模型表示物理模型:1)概念数据模型在计算机内部具体的存储形式和操作机制,用一个有效容错的方式2)执行逻辑数据模型的理论基础,使用现在的构件邻接表、邻接矩阵表示基于内存的物理模型:邻接表、邻接矩阵基于外存的物理模型:规范化表结构:用两个关系R和S来分别描述结点和边非规范化表结构:采用非规范化表结构可以加快边的查询速度6、象形图:象形图是一种将对象插在方框内的微缩图表示,这些微缩图用来扩展ER图,并插到实体矩形框中的适当位置7、空间索引:是指根据空间对象的位置和形状或空间对象之间的某种空间关系按一定的顺序排列的一种数据结构,其中包含空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针空间索引文件:是用来提高空间数据查询效率的辅助文件。索引文件的记录只有两个域,即码域和空间数据的页面地址8.主存:用于暂时存放CPU中的运算数据,以及与硬盘等外部存储器交换的数据特点作用主存读取数据快,但断电数据就会丢失提高性能二级存储读取数据较慢,但断电数据不丢失储存三级存储读取数据更慢,容量大备份硬盘驱动器存取时间(ta)ta=ts+tv+ttts为寻道时间,tv为延迟时间,tt为传输时间通常,tstvtt9、从软件的角度,数据在磁盘上以域、记录、文件这种层次结构的形式存放的。文件:文件是记录的集合,类似于整个关系表记录:每条记录都是相同或不同类型的域的集合。表的“行”称为“记录”,对应于关系表的一行,即一个实体,是属性的集合域:域是一种管理边界,用于一组计算机共享共用的安全数据库,域实际上是一组服务器和工作站的集合。是属性的取值范围,表示一个关系表或实体属性文件结构:一种组织文件中记录顺序的方法,以便于对文件的各种操作。包括:无序文件(堆)、散列文件、有序文件、聚类文件10、空间填充曲线:空间填充曲线是利用一个线性顺序来填充空间,可以获得丛一端到另一端的曲线。多维空间本身没有自然排序
本文标题:空间数据库整理部分资料
链接地址:https://www.777doc.com/doc-2151768 .html