您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 人事档案/员工关系 > 第10章分布式数据库
第10章分布式数据库1第10章分布式数据库10.1分布式数据库系统的基本概念10.2分布式数据库系统的特点10.3分布式数据库系统的体系结构10.4分布式数据库管理系统第10章分布式数据库210.1分布式数据库系统的基本概念10.1.1集中式数据库系统10.1.2分布式数据库系统第10章分布式数据库310.1.1集中式数据库系统集中式数据库系统将所有数据集中存储到一台计算机上,由主机上的数据库管理系统统一管理整个数据库,用户可从终端上发出数据操作命令,经主机上的数据库管理系统接收处理后,将结果数据返回给用户。集中式数据库系统中具有数据集中管理、冗余度低、应用程序和数据库的数据结构相对独立、数据恢复能力强等优点。第10章分布式数据库410.1.2分布式数据库系统1.分布式数据库系统(DDBS)分布式数据库系统是物理上分散逻辑上集中的数据库系统,系统中的数据分布存放在计算机网络的不同场地,每一场地都有自治处理即独立处理能力并能完成局部应用,同时每一场地也至少参与一种全局应用,程序通过网络通信子系统执行全局应用。这里的场地亦即结点,是指计算机网络中的一台计算机。第10章分布式数据库510.1.2分布式数据库系统DDBS有两个重要的组成部分:分布式数据库(DDB)和分布式数据库管理系统(DDBMS)。图10.1为一个DDBS示意图。网络DDBMS场地3图10.1DDBS示意图DDBMS场地2DDBMS场地1第10章分布式数据库610.1.2分布式数据库系统2.分布式数据库DDB是计算机网络环境中各场地上数据库的逻辑集合,也就是说,DDB是一组结构化的数据集合,逻辑上属于同一系统,物理上却分布在计算机网络的各个不同场地。DDB具有数据分布性和逻辑整体性两个特点。第10章分布式数据库710.1.2分布式数据库系统3.分布式数据库管理系统DDBMS是实现分布式数据处理的一种典型数据库管理软件,用于支持分布式数据库的创建、运行、管理和维护。它能对分布于各个场地的软、硬件资源进行统一管理和控制,使其在逻辑上可视为一个整体的数据库系统,并为用户提供与分布式数据的接口。同时,由于数据的分布性,在管理机制上还必须具有计算机网络通信协议的分布管理特性。第10章分布式数据库810.2分布式数据库系统的特点10.2.1分布式数据库系统的特点10.2.2分布式数据库系统的优缺点第10章分布式数据库910.2.1分布式数据库系统的特点分布式数据库系统具有以下特点:•数据的物理分布性•数据的逻辑整体性•数据的分布独立性•场地自治性•场地之间的协调性•数据冗余及冗余透明性•事务管理的分布性第10章分布式数据库1010.2.2分布式数据库系统的优缺点1.分布式数据库系统的优点DDBS的上述特点决定它具有以下优点:(1)灵活的体系结构。集中式数据库系统强调的是集中式控制,而DDBS更多地强调各个场地局部DBMS的自治性,大部分的局部事务管理和控制就地解决,只有涉及其它场地数据时才通过网络作为全局事务处理。DDBMS可以设计成不同程度的自治性,从具有充分的场地自治性到几乎完全的集中式控制。第10章分布式数据库1110.2.2分布式数据库系统的优缺点(2)数据共享。DDBS中的数据共享有两个层次:局部共享和全局共享。即各场地的用户可共享本场地局部数据库中的数据;全体用户可共享网络中所有局部数据库中的数据。(3)可靠性高、可用性好。由于存在冗余数据,个别场地或个别链路的故障不会导致整个系统的崩溃。同时,系统可自动检测故障所在,并利用冗余数据恢复出故障的场地,这种检测和修复是在联机状态下完成的。第10章分布式数据库1210.2.2分布式数据库系统的优缺点(4)性能得到改善。局部应用只访问本地数据库,系统响应快、通信开销小;由于冗余数据的存在,系统可选择离用户最近的数据副本进行操作,也缩短了响应时间和减少了通信开销;每个场地只处理整个数据库的一部分,因此CPU和I/O争用也不如集中式数据库激烈;由于一个事务所涉及的数据可能分布在多个场地,因此增加了并行处理事务的可能性。第10章分布式数据库1310.2.2分布式数据库系统的优缺点(5)可扩充性好。当增加新的应用时,可在新系统中增加新的结点而不影响现有系统的结构和系统的正常运行,而且这种扩充不受结点计算机存储容量和处理能力的限制。(6)提高资源利用率。当一个组织需要利用已有的几个数据库开发全局应用时,可以将这些数据库联合起来建立分布式数据库,而不必重新开发新的数据库系统,减少了开发费用,提高了资源利用率。第10章分布式数据库1410.2.2分布式数据库系统的优缺点2.分布式数据库系统的缺点在存在上述优点的同时,DDBS也存在以下缺点:(1)复杂。与集中式数据库系统相比,DDBS更复杂,为保证各场地之间的协调必须做很多额外的工作。(2)系统开销大。系统开销主要包括硬件开销、通信开销、数据冗余的潜在开销,以及为保证数据库全局并行性、并行操作的可串行性、安全性和完整性等的开销。第10章分布式数据库1510.2.2分布式数据库系统的优缺点(3)数据安全性和保密性较难处理。每个场地的数据安全不能保证全局的数据是安全的,安全性问题是分布式系统的固有问题。分布式系统是通过网络实现分布控制的,而通信网络本身在保证数据安全方面存在弱点,数据很容易被窃取。第10章分布式数据库1610.3分布式数据库系统的体系结构10.3.1分布式数据库系统体系结构10.3.2数据分片10.3.3分布透明性第10章分布式数据库1710.3.1分布式数据库系统体系结构分布式数据库系统的体系结构则是:(n个)局部数据模式+(1个)全局数据模式。如图10.2所示图10.2DDBS的体系结构映像1局部数据库全局概念模式全局外模式全局外模式全局外模式分片模式分配模式局部外模式局部外模式局部概念模式局部内模式全局DBMS局部数据库局部外模式局部外模式局部概念模式局部内模式局部数据模式全局数据模式局部DBMS映像2映像3映像4第10章分布式数据库1810.3.1分布式数据库系统体系结构由图10.2可见,一个分布式数据库系统包含全局外模式、全局概念模式、分片模式、分配模式、局部概念模式、局部内模式等层次,各模式之间有相应的映像定义。1.全局外模式全局外模式(GlobalExternalSchema)由全局用户视图组成,是全局概念模式的子集。2.全局概念模式全局概念模式(GlobalConceptualSchema)定义分布式数据库系统中所有数据的整体逻辑结构,是全局应用的公共数据视图。第10章分布式数据库1910.3.1分布式数据库系统体系结构3.分片模式分片模式(FragmentationSchema)是全局数据整体逻辑结构分割后的局部逻辑结构,是DDBS的全局数据的逻辑划分视图。4.分配模式分配模式(AllocationSchema)用于根据选定的数据总体分配方案,定义各片段的物理存放地点。第10章分布式数据库2010.3.1分布式数据库系统体系结构目前常用的数据总体分配方案有:(1)划分式(Partitioned)。每个片段只分配到某一个场地上,片段没有副本。(2)全副本式(FullyReplicated)。每一场地都拥有所有片段的副本。(3)部分重复式(PartiallyReplicated)。部分片段冗余分配,是目前最常用的分配方案。第10章分布式数据库2110.3.1分布式数据库系统体系结构5.局部概念模式局部概念模式(LocalConceptualSchema)是全局概念模式被分片和分配到局部场地上的映像的逻辑结构及特征的描述,是全局概念模式的子集。其逻辑结构与局部DBMS所支持的数据模型有关,当全局数据模型与局部数据模型不同时,局部概念模式还应包括数据模型转换的描述。6.局部内模式局部内模式(LocalInternalSchema)描述局部概念模式涉及的数据在局部DBMS中的物理结构及物理存储细节,完全与非分布式系统相同第10章分布式数据库2210.3.1分布式数据库系统体系结构7.映像上述各层模式之间的联系和转换是由各层模式间的映像实现的。DDBS中除保留集中式数据库中的(局部)外模式/(局部)概念模式映像、(局部)概念模式/(局部)内模式映像外还包括以下几种映像:映像1:定义全局外模式与全局概念模式之间的对应关系。第10章分布式数据库2310.3.1分布式数据库系统体系结构映像2:定义全局概念模式与分片模式之间的对应关系。映像3:定义分片模式与分配模式之间的对应关系,即定义片段与各场地之间的对应关系。映像4:定义分配模式与局部概念模式之间的对应关系,即定义存储在局部场地的全局关系或其片段与各个局部概念模式之间的对应关系。第10章分布式数据库2410.3.2数据分片1.数据分片的目的数据分片将数据库整体逻辑结构分解为合适的逻辑单位——片段,然后由分配模式来定义片段及其副本在各场地的物理分布,其主要目的是提高访问的局部性,有利于按照用户的需求组织数据的分布和控制数据的冗余度。第10章分布式数据库2510.3.2数据分片2.数据分片应遵循的准则(1)完整性。全局关系的所有数据都必须分配到各个片段中,不允许某些数据属于全局关系但不属于任何片段。(2)重构性。分裂后各个片段可以重构原来的全局关系。(3)不相交性。全局关系中的每个元组仅属于一个片段,不能在多个片段中重复出现。此规则不是必须的,因为在有冗余DDBS中数据可有多个副本。第10章分布式数据库2610.3.2数据分片3.常用的数据分片方式(1)水平分片。水平分片把一个全局关系中的元组分裂成多个子集,每个子集为一个片段。分片条件由关系中的属性值表示。(2)垂直分片。垂直分片把一个全局关系按列分裂成多个子集,应满足不相交性(关键字除外)。(3)导出分片。导出分片也是一种水平分片,但分片的限定条件不是该关系中的属性,而是由与该关系有联系的其他关系导出的。第10章分布式数据库2710.3.3分布透明性分布透明性是分布式数据库系统要实现的主要目标之一,这里的透明性是指对用户隐匿了数据的具体位置,用户不必了解数据在何处和如何得到它们。分布透明性有三个层次,从高到低依次为:分片透明性、位置透明性和局部数据模型透明性。(1)片透明性分片透明性位于全局概念模式与分片模式之间(图10.2中的映像2),是指用户只需对全局关系进行操作,不必考虑数据的分片及存储场地,其应用程序的编写与集中式数据库相同。当分片模式改变时,只需改变全局概念模式到分片模式之间的映像,而不会影响到全局概念模式和应用程序。第10章分布式数据库2810.3.3分布透明性(2)位置透明性位置透明性位于分片模式与分配模式之间(图10.2中的映像3),是指用户不必知道数据的存储场地,即数据分配到哪个或哪些场地存储对用户是透明的。当存储场地发生变化时,只需改变分片模式到分配模式之间的映像,而不会影响分片模式、全局概念模式和应用程序。(3)局部数据模型透明性局部数据模型透明性也称局部映像透明性,位于分配模式与局部概念模式之间(图10.2中的映像4),是指用户不用考虑局部DBMS所支持的数据模型、使用哪种数据操纵语言,但要考虑数据如何分片、片段及其副本在各场地上的分配。第10章分布式数据库2910.4分布式数据库管理系统10.4.1分布式数据库管理系统的功能10.4.2分布式数据库管理系统的组成10.4.3分布式数据库管理系统的分类第10章分布式数据库3010.4.1分布式数据库管理系统的功能分布式数据库管理系统主要功能包括:(1)用户能够对网络上任意场地数据库的数据进行远程存取,执行全局应用。(2)支持透明存取,提供一定级别的分布透明性。(3)支持对分布式数据库的管理与控制。(4)支持对分布式事务的并发控制和恢复。第10章分布式数据库3110.4.2分布式数据库管理系统的组成图10.4为一个典型DDBMS的结构图,包括四个部分:全局数据库管理系统GDBMS(GlobalDBMS)、全局数据字典GDD(GlobalDataDictionary)、局部数据库管理系统
本文标题:第10章分布式数据库
链接地址:https://www.777doc.com/doc-5832322 .html