您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文化 > 第2章 关系模型与关系数据库
LOGO第1部分数据库系统基础第2章关系模型与关系数据库高级数据库系统及其应用2020/2/232第2章关系模型与关系数据库关系数据模型2.1关系操作与关系查询语言2.2SQL语言2.3应用关系数据库2.42020/2/2332.1关系数据模型2.1.1关系模型基础2.1.2关系模型的约束及其表达2.1.3关系数据库2020/2/2342.1.1关系模型基础关系(表)关系模型将数据库表示为一组“关系(relation)”的集合。每个关系好比一个具有多个行(row)和多个列(column)的二维值表(table)。每个关系含两部分信息:关系模式(relationschema)和关系实例(relationinstance)。在正式的关系模型术语中•表行:被称为记录(record)或元组(tuple)•表列标题:被称为属性(attribute)或字段(field)。2020/2/235一个简单关系表的关系模式和关系实例示例(图2.1)2020/2/236其它几个重要的关系模型概念(1)属性域在关系模型中,必须为每个属性指定一个域(domain)。关系模式(relationschema)指一个关系的基本模式结构定义。形式上,名为R的关系模式可表示为:•R(A1[:dom(A1)],…,An[:dom(An)])关系实例(关系状态)关系的每个数据行称为一个元组,可形式表示为•t=v1,v2,…,vn,关系的实例(状态)是一个元组集或记录集,可形式表示为:•r(R)={t1,t2,…,tn}2020/2/237其它几个重要的关系模型概念(2)关系数据库模式(Schema,S)指由一个关系模式集{R1,R2,…,Rn}和一个关系约束集ICs构成的定义集;S={R1,R2,…,Rn}+ICs。关系数据库状态指特定时刻DB中所有关系状态的集合,即DB={r1,r2,…,rn},其中,ri是关系Ri的状态。关系数据库关系数据库(RDB),是采用关系模型来表示数据的数据库。RDB的一个状态也称为一个RDB实例。2020/2/2382.1.2关系模型的约束及其表达完整性约束(IntegrityConstraints,ICs)DBMS必须能强制实施与DB模式有关的所有约束,以限制允许存储到DB的数据,确保DB中只有满足约束的合法数据。ICs的主要类型包括域约束、主键约束和外键约束,它们常被统称为基于模式的约束。键约束超键(superkey,SK)的概念•能唯一标识关系R中每个元组的一个属性子集•超键中可能会有冗余属性候选键(CandidateKey)•没有冗余属性的超键2020/2/239引用完整性约束引用完整性约束(referentialintegrityconstraint)指要在两不同关系之间指定,用来维护两关系元组间一致性的一种关系模型约束。该约束指定:当某关系元组引用另一个关系中元组时,只能引用已经存在的元组。外键(ForeignKey,FK)定义外键条件指定了两个关系模式R1和R2之间的一个引用完整性约束,或简称为外键约束。2020/2/2310约束指定--应用实例2020/2/23112.2关系操作与关系查询语言2.2.1关系代数2.2.2关系演算本章查询表达说明用例模式(“水手值勤服务”)Sailors(sid:integer,sname:string,rating:integer,age:integer);Boats(bid:integer,bname:string,color:string);Reserves(sid:integer,bid:integer,day:date);关系查询语言的两种属性引用方法:(1)属性名(2)属性在关系模式中的位置或顺序号关系模型中除了引入描述DB结构和约束的概念外,还引用了一组可操纵DB的操作----通过基于模型的专门语言,来表达模型操作。本节介绍:基于关系模型的两种模型语言--关系代数/关系演算。下节介绍:以这两种形式语言为基础的关系模型标准化语言(SQL)2020/2/2312“水手值勤服务”的一个简单模式实例2020/2/23132.2.1关系代数关系代数由一组操作符构成。每个操作符接受1或2个关系实例作为参数,返回一个关系实例作为结果。以下三个方面因素,可突显关系代数在RDBMS中的重要性和地位:它为关系模型操作提供了一个形式化的基础;是RDBMS查询实现和优化的基础;SQL结合并保留了很多关系代数的基本概念关系代数操作符的两种主要类型:基于集合论的操作,包括并、交、差和叉积等,这些操作的适用性源于“关系”本质上是元组集合;另一类操作则是专门为RDBMS开发的操作,包括选择、投影、连接,以及为聚合运算引入的相关操作。2020/2/23141.并、交、差运算并、交、差这三个运算操作都可对应到集合论操作,它们都属于二元操作符,要求有两个被操作对象,且要求这两个关系是相容的。并(R∪S):R∪S={t|t∊Rt∊S}交(R∩S):R∩S={t|t∊R∧t∊S}差(R-S):R-S={t|t∊R∧t∉S}2020/2/23152.叉积操作叉积,也称为笛卡儿积(cartesianproduct),操作符用表示,属于二元关系操作符,代数表达式为RS。2020/2/23163.选择操作与投影操作选择操作符表示为σc(R),其中,c为条件表达式。投影操作符表示为πL(R),其中,L为投影输出的属性子集列表A1’,…,Am’。2020/2/23174.重命名操作在许多场合,输出列名可以直接使用输入关系的属性名。但当输出列为表达式,或二元操作两个输入关系中含同名属性,或希望改善原属性名的可读性等,都需要重命名机制。关系代数中引入了一个重命名操作符(ρ),其代数表达形式为:ρ(R’(A1A1’,…,AiAi’,…),E)例2.6基于图2.4(d)的S1×R1,写出表达式ρ(R’(1sid1,5sid2),S1×R1)返回的R’模式。2020/2/23185.连接操作连接操作(⋈c),用来合并两个关系中的信息――将两关系中相关的“元组对”合并成一个元组输出。虽然在概念上,R⋈cS=L(σc(RS));但按这种方法实现连接操作的效率很低。在RDBMS中,连接操作通常以独立于叉积结果的方法实现。2020/2/23196.消除重复与排序运算消除重复运算的表达式为(RB),其操作对象可以是包型关系或集合型关系。消除重复是一个代价较大的操作,故在很多实际系统中,默认情况下的投影输出都不自动消除重复。排序操作的代数符号表达式为TL(R)。该操作用来将关系R的所有元组,按L所指定方式排序输出。L是一个属性表达列表,具有形如A1[asc|desc],A2[asc|desc],…的形式2020/2/23207.分组与聚合操作分组(grouping)与聚合(aggregating)操作的代数表达式为γL(R),该操作将关系R的所有元组按L指定方式进行分组。L是一个列表表达式。聚合关系与原关系R一般具有不同的模式结构。聚合关系中的属性,必须或者是出现L中的属性,或是一个聚合函数表达式。很多DB书籍或文献中,都将aggregating运算译为聚集。本书中,考虑到已将clustering译为聚簇、聚集。为避免混淆,同时也考虑到合计汇总运算这个语义,故采用‘聚合’这个译法。2020/2/23212.2.2关系演算(relationalcalculus)关系演算为关系DB查询提供了一种高级描述性表示法。它是一种形式化语言,其基础是被称为谓词(predicate)演算的数理逻辑分支――一阶谓词逻辑(FirstOrderLogic,FOL)。在演算表达式中,不需给出如何应获取结果的操作次序指示信息,只描述了结果中应当包括的信息。关系演算表达式描述了一个新的关系,这个新关系以变量形式来指定,变量取值范围可是是新关系中的元组(元组演算),或是新关系中的属性域(域演算)。元组演算对商业化关系查询语言SQL发展有重要影响;域演算则是QBE(Query-By-Example语言)的基础。2020/2/2322元组关系演算(TupleRelationalCalculus,TRC)元组变量是取值范围限为特定关系元组的变量。TRC查询的基本表达形式{t|p(t)},•t代表一个元组变量,而p(t)则是t应当满足的逻辑公式。查询结果是能使逻辑公式p(t)为真值的所有元组t集合。构造TRC查询表达的核心任务是给出逻辑公式p(t),本质上TRC逻辑公式是FOL公式的一个子集。应用举例要检索职级超过7的水手,•TRC表达为:{S|S∊Sailors∧S.rating7}2020/2/2323TRC原子公式,是下面形式之一:R∊Rel是最基本原子公式,表达元组变量R的取值。R.aopS.b或R.aopconst或constopR.a是比较型原子公式,表达R在其指定属性上的取值限定。任何TRC公式可由如下任一方法递归地构造产生:任何一个原子公式。┐p(取反),p∧q(‘与’连接构造),p∨q(‘或’连接构造),p⇒q(蕴涵:若p为真,q必为真)。∃R(p(R)),R是元组变量。∀R(p(R)),R是元组变量。TRC查询的语法与语义令Rel是关系名;逻辑操作符op∊{,,=,≤,≥,≠};R和S是元组变量,a与b分别是R与S的一个属性;p和q是一个TRC公式。•该表达语义是:对p(R)中的每个自由变量(包括R),至少存在一个能使公式p(R)为真的元组赋值。(绑定到变量R的存在量词)通常一个公式p(R)中会包含一个R∊Rel条件,以及一些关于R的量词限定表达。为简洁起见,常用∃R∊Rel(p(R))替代∃R(R∊Rel∧p(R))常用∀R∊Rel(p(R))替代∀R(R∊Rel⇒p(R)2020/2/2324域关系演算(DomainRelationalCalculus,DRC)DRC公式可按类似TRC公式的方式进行形式定义。这两类公式定义的主要差别是变量的取值范围。令X和Y是域变量。DRC原子公式是下面形式之一:x1,x2,…,xn∊RelRel是含有n个属性的关系名,每个xi,1≤i≤n,或是一个变量,或是一个常数。XopY或Xopconstant或constantopX任何DRC公式可由如下任一方法递归地构造产生。任何一个DRC原子公式;┐p(取反),p∧q(与连接构造),p∨q(或连接构造),p⇒q(蕴涵:若p为真,q必为真)∃X(p(X)),X是x1,x2,…,xn。∀X(p(X)),X是x1,x2,…,xn。2020/2/2325DRC查询示例(Q3)查询被指派到103号船值勤的水手名{N|∃I,T,A(I,N,T,A∊Sailors∧∃Ir,Br,D(Ir,Br,D∊Reserves∧Ir=I∧Br=103))}若引入简记法,也可改写为:{N|∃I,T,A(I,N,T,A∊Sailors∧∃Ir,Br,D∊Reserves(Ir=I∧Br=103))}该式还可用如下更简洁的写法:•{N|∃I,T,A(I,N,T,A∊Sailors∧∃D(I,103,D∊Reserves))}(Q4)查询曾在一个红船上值勤过的所有水手名字{N|∃I,T,A(I,N,T,A∊Sailors∧∃I,Br,D∊Reserves∧∃Br,Bn,’red’∊Boats}2020/2/23262.3SQL语言2.3.1用DDL定义数据库2.3.2用DML操纵数据库2.3.3视图2020/2/2327SQL语言简介SQL是结构化查询语言(StructuredQueryLanguage)的缩写。SQL发展简史最初由IBM研究院设计实现,并作为IBM早期数据库系统SYSTEMR的接口
本文标题:第2章 关系模型与关系数据库
链接地址:https://www.777doc.com/doc-3931511 .html