您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 人事档案/员工关系 > 分布式数据库系统..
第5讲分布式数据库系统本章主要内容(1)分布计算的三种形式:处理分布,数据分布,功能分布。(2)C/S系统,工作模式,技术特征,体系结构,两层、三层、多层C/S结构。(3)DDBS的定义、特点、优点、缺点和分类;分布式数据存储的两种形式(分片和分配)。(4)DDB的体系结构:六层模式,分布透明性的三个层次,DDBS的组成,DDBMS的功能和组成。(5)分布式查询处理的查询代价,基于半联接的优化策略,基于联接的优化策略。(6)分布式数据库的并发控制和恢复中出现的问题,以及处理机制。前言随着传统的数据库技术日趋成熟、计算机网络技术的飞速发展和应用范围的扩充,数据库应用已经普遍建立于计算机网络之上。这时集中式数据库系统表现出它的不足:数据按实际需要已在网络上分布存储,再采用集中式处理,势必造成通信开销大;应用程序集中在一台计算机上运行,一旦该计算机发生故障,则整个系统受到影响,可靠性不高;集中式处理引起系统的规模和配置都不够灵活,系统的可扩充性差。在这种形势下,集中式DB的“集中计算”概念向“分布计算”概念发展。分布计算主要体现在客户机/服务器模式和分布式数据库体系结构两个方面。本章将分别介绍这两种技术。11.1集中计算与分布计算(一)“集中计算”概念用户终端主机DB∫∫存取请求通信线路处理结果11.1集中计算与分布计算(二)“分布计算”概念①处理分布②数据分布③功能分布11.1集中计算与分布计算(三)客户机/服务器系统的结构用户客户机服务器DB∫∫数据请求处理结果11.2.1C/S系统的计算模式客户:一般为网络用户的计算机处于主动的地位,可以向服务器发出各种请求服务器:网络上能够提供特定服务的主机处于被动的地位,根据客户的请求做出相应的回答,提供相应的服务。11.2.2C/S系统的体系结构①服务器②客户机③中间件11.2.3C/S结构的演变(一)两层C/S结构DB服务器……客户机1客户机N用户用户第一层第二层11.2.3C/S结构的演变(二)三层C/S结构DB应用服务器……客户机1客户机N用户1用户N第一层第二层DB服务器第三层用户/S结构的演变(三)多层C/S结构用户网络服务器的类型①DB服务器②文件服务器③事务服务器④文档服务器⑤Web服务器⑥电子邮件服务器⑦其他应用服务器11.3分布式数据库系统概述随着传统的数据库技术日趋成熟、计算机网络技术的飞速发展和应用范围的扩大,以分布式为主要特征的数据库系统的研究与开发受到人们的注意。分布式数据库是数据库技术与网络技术相结合的产物,在数据库领域已形成一个分支。分布式数据库的研究始于20世纪70年代中期。世界上第一个分布式数据库系统SDD-1是由美国计算机公司(CCA)于1979年在DEC计算机上实现。20世纪90年代以来,分布式数据库系统进入商品化应用阶段,传统的关系数据库产品均发展成以计算机网络及多任务操作系统为核心的分布式数据库产品,同时分布式数据库逐步向客户机/服务器模式发展。11.3.1从集中式、分散式到分布式随着数据库应用的不断发展,规模的不断扩大,逐渐感觉到集中式系统也有不便之处。如大型DBS的设计和操作都比较复杂,系统显得不灵活并且安全性也较差。因此,采用将数据分散的方法,把数据库分成多个,建立在多台计算机上,这种系统称为分散式系统。在这种系统中,数据库的管理、应用程序的研制等都是分开并相互独立,它们之间不存在数据通信联系。由于计算机网络通信的发展,有可能把分散在各处的数据库系统通过网络通信连接起来,这样形成的系统称为分布式数据库系统(DDBS)。DDBS兼有集中式和分散式的优点。这种系统有多台计算机组成,各计算机之间由通信网络相互连接着。11.3.2DDBS的定义分布式系统是用通信网络连接起来的结点(亦称为“场地”)的集合,每个结点都是拥有集中式数据库的计算机系统。定义11.1DDBS是物理上分散逻辑上集中的数据库系统,系统中的数据分布存放在计算机网络的不同场地的计算机中,每一场地都有自治处理(即独立处理)能力并能完成局部应用,而每一场地也参与(至少一种)全局应用,程序通过网络通信子系统执行全局应用。定义11.2DDB是计算机网络环境中各场地上数据库的逻辑集合。定义11.3DDBMS是DDBS中的一组软件,它负责管理分布环境下逻辑集成数据的存取、一致性和完备性。11.3.3DDBS的特点和优缺点(一)DDBS的基本特点①物理分布性:数据不是存储在一个场地上,而是存储在计算机网络的多个场地上。②逻辑整体性:数据物理分布在各个场地,但逻辑上是一个整体,它们被所有用户(全局用户)共享,并由一个DDBMS统一管理。③场地自治性:各场地上的数据由本地的DBMS管理,具有自治处理能力,完成本场地的应用(局部应用)。④场地之间协作性:各场地虽然具有高度的自治性,但是又相互协作构成一个整体。11.3.3DDBS的特点和优缺点(二)DDBS的其他特点①数据独立性②集中与自治相结合的控制机制③适当增加数据冗余度④事务管理的分布性11.3.3DDBS的特点和优缺点(三)DDBS的优点①具有灵活的体系结构②适应分布式的管理和控制机构③经济性能优越④系统的可靠性高、可用性好⑤局部应用的响应速度快⑥可扩展性好,易于集成现有的系统11.3.3DDBS的特点和优缺点(四)DDBS的缺点①系统开销较大,主要花在通信部分。②复杂的存取结构(如辅助索引、文件的链接技术),在集中式DBS中是有效存取数据的重要技术,但在分布式系统中不一定有效。③数据的安全性和保密性较难处理。11.3.4DDBS的分类①同构同质型DDBS:各个场地都采用同一类型的数据模型(譬如都是关系型),并且是同一型号的DBMS。②同构异质型DDBS:各个场地采用同一类型的数据模型,但是DBMS的型号不同,譬如DB2、ORACLE、SYBASE、SQLServer等。③异构型DDBS:各个场地的数据模型的型号不同,甚至类型也不同。随着计算机网络技术的发展,异种机联网问题已经得到较好的解决,此时依靠异构型DDBS就能存取全网中各种异构局部库中的数据。11.4.1数据分片(一)①水平分片按一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子集为关系的一个片段。②垂直分片把一个全局关系的属性集分成若干子集,并在这些子集上作投影运算,每个投影称为垂直分片。③导出分片又称为导出水平分片,即水平分片的条件不是本关系属性的条件,而是其他关系属性的条件。④混合分片以上三种方法的混合。可以先水平分片再垂直分片,或先垂直分片再水平分片,或其他形式,但他们的结果是不相同的。11.4.1数据分片(二)①完备性条件必须把全局关系的所有数据映射到片段中,决不允许有属于全局关系的数据却不属于它的任何一个片段。②可重构条件必须保证能够由同一个全局关系的各个片段来重建该全局关系。对于水平分片可用并操作重构全局关系;对于垂直分片可用联接操作重构全局关系。③不相交条件要求一个全局关系被分割后所得的各个数据片段互不重叠(对垂直分片的主键除外)。水平分片事例例:下图所示的工程管理数据库事例中关系PROJ按工程所在地LOC属性值进行划分。其水平分片为:PROJ1=σLOC=”Montreal”(PROJ)PROJ2=σLOC=”NewYork”(PROJ)PROJ3=σLOC=”Paris”(PROJ)其水平划分的分片如图所示。PNOPNAMEBUDGETLOCP1Instrumentation150000MontrealP2DatabaseDevelop.135000NewYorkP3CAD/CAM250000NewYorkP4Maintenance310000ParisPROJPROJ1PNOPNAMEBUDGETLOCP1Instrumentation150000MontrealPROJ2PNOPNAMEBUDGETLOCP2DatabaseDevelop.135000NewYorkP3CAD/CAM250000NewYorkPNOPNAMEBUDGETLOCP4Maintenance310000ParisPROJ3垂直分片事例例:工程管理数据库事例中关系PROJ(PNO,PNAME,BUDGET,LOC)划分成两个子关系:一个包括工程预算信息,即对BUDGET属性感兴趣;一个包括工程信息,对PNAME、LOC属性感兴趣。为了保证划分后重构,可将PNO作为公共属性分别包括在这二个分片中。这样PROJ可划分为:PROJ1=ΠPNO,BUDGET(PROJ)PROJ2=ΠPNO,PNAME,LOC(PROJ)其垂直划分的分片如图所示。PROJ1PNOBUDGETP1150000P2135000P3250000P4310000PROJ2PNOPNAMELOCP1InstrumentationMontrealP2DatabaseDevelop.NewYorkP3CAD/CAMNewYorkP4MaintenanceParisPNOPNAMEBUDGETLOCP1Instrumentation150000MontrealP2DatabaseDevelop.135000NewYorkP3CAD/CAM250000NewYorkP4Maintenance310000ParisPROJ诱导分片事例例:工程管理数据库事例中关系PROJ按工程所在地LOC属性值进行水平划分为:PROJ1=σLOC=”Montreal”(PROJ)PROJ2=σLOC=”NewYork”(PROJ)PROJ3=σLOC=”Paris”(PROJ)则使有关联的ASG产生诱导划分,其诱导分片为:ASG1=ASG⋉PROJ1=ASG⋉σLOC=”Montreal”(PROJ)=∏ENO,PNO,DESP,DUR(ASG⋈σLOC=”Montreal”(PROJ))=ASG⋈(∏PNO(σLOC=”Montreal”(PROJ))同理:ASG2=ASG⋉PROJ2=∏ENO,PNO,DESP,DUR(ASG⋈σLOC=”NewYork”(PROJ))ASG3=ASG⋉PROJ2==∏ENO,PNO,DESP,DUR(ASG⋈σLOC=”Paris”(PROJ))其诱导划分的分片如图所示。PNOPNAMEBUDGETLOCP1Instrumentation150000MontrealP2DatabaseDevelop.135000NewYorkP3CAD/CAM250000NewYorkP4Maintenance310000ParisPROJASGENOPNODESPDURE1P1Manager12E2P1Analyst24E2P2Analyst6E3P3Consultant10E3P4Engineer48E4P2Programmer18E5P2Manager24E6P4Manager48E7P3Engineer36E8P3Manager40ASG1ENOPNODESPDURE1P1Manager12E2P1Analyst24ENOPNODESPDURE2P2Analyst6E3P3Consultant10E4P2Programmer18E5P2Manager24E7P3Engineer36E8P3Manager40ASG2ENOPNODESPDURE3P4Engineer48E6P4Manager48ASG3PROJ1PNOPNAMEBUDGETLOCP1Instrumentation150000MontrealPROJ2PNOPNAMEBUDGETLOCP2DatabaseDevelop.135000NewYorkP3CAD/CAM250000NewYorkPNOPNAMEBUDGETLOCP4Maintenance310000ParisPROJ3混合分片事例PROJ1PNOBUDGETP1150000P2135000P3250000P43100
本文标题:分布式数据库系统..
链接地址:https://www.777doc.com/doc-3850818 .html