您好,欢迎访问三七文档
11第2章关系数据库基本原理22本章内容1.1关系数据库基本原理2.2关系代数的基本原理2.3关系模式的分解2.4关系模型的完整性约束2.5数据库的设计方法332.1关系数据库概述关系数据模型数据模型的任务是描述现实世界中的实体及其联系。关系数据模型就是采用一个有序数组描述实体及其属性,用这种有序数组的集合描述一个实体集合,而采用定义在两个集合上的关系反映不同实体间的联系。部门编号部门名称员工编号员工姓名性别住址D001总经理办E001钱达理男东风路78号D001总经理办E002东方牧男五一北路25号D002市场部E003郭文斌男公司集体宿舍D003销售部E004肖海燕女公司集体宿舍D004仓储部E005张明华男韶山北路55号表2-1关系模型示例442.1关系数据库概述关系数据库基本概念定义:关系数据库就是一些相关的二维表和其他数据库对象的集合。在这个定义中明确,关系数据库中的所有信息都存储在二维表格中;一个关系数据库可能包含多个表;除了这种二维表外,关系数据库还包含一些其他对象,如视图等。关系模型的基本概念:1.关系一个关系就是一张二维表,通常将一个没有重复行、重复列的二维表看成一个关系,每个关系都有一个关系名。552.1关系数据库概述2.元组二维表的每一行在关系中称为元组(Tuple)。一行描述了现实世界中的一个实体,或者描述了不同实体间的一种联系。3.属性二维表的每一列在关系中称为属性(Attribute),每个属性都有一个属性名,各个属性的取值称为属性值。每个属性有一定的取值范围,称为值域。4.关键字关系中能惟一区分、确定不同元组的属性或属性组合,称为该关系的一个关键字。关键字又称为键或码(Key)。662.1关系数据库概述5.外部关键字如果关系中某个属性或属性组合并非关键字,但却是另一个关系的主关键字,则称此属性或属性组合为本关系的外部关键字或外键(ForeignKey)。在关系数据库中,用外部关键字表示两个表间的联系。772.1关系数据库概述关系数据库基本特征有坚实的理论基础数据结构简单、易于理解对用户提供了较全面的操作支持得到了众多开发商的支持882.2关系代数的基本原理关系的数学定义1.集合集合没有严格的形式定义,一般说来,集合是与某一研究过程相关的一类对象的整体,这些对象称为集合的元素。2.元组几个元素组成的一个有序组称为一个元组,通常元组用圆括号括起来的一些元素表示,元素间使用逗号分隔。例如(3,5,6)和(E001,钱达理,男,东风路78号)是元组的例子。在关系数据库中,可以把一个表的每一行看作一个元组。992.2关系代数的基本原理3.集合的笛卡尔乘积设A1、A2、…、An为任意集合,A1、A2、…、An的笛卡尔乘积记做:A1×A2×…×An,并且定义D=A1×A2×…×An={(a1,a2,…,an)|ai∈Ai,i=1,2,…,n},其中(a1,a2,…,an)是一个元组,它的每个元素ai取自对应的集合Ai。例如,设A={1,2},B={a,b},则A×B={(1,a),(1,b),(2,a),(2,b)}。4.关系关系是一个集合,其组成元素是元组而不是组成元组的元素。10102.2关系代数的基本原理关系运算对二维表格进行运算的机制。1.并设A、B同为n元关系,则A、B的并也是一个n元关系,记作A∪B。2.交设A、B同为n元关系,则A、B的交也是一个n元关系,记作A∩B。A∩B包含了所有同属于A、B的元组。3.差设A、B同为n元关系,则A、B的差也是一个n元关系,记作A-B。A-B包含了所有属于A但不属于B的元组。11112.2关系代数的基本原理例2-1设A={(湖南,长沙),(河北,石家庄),(陕西,西安)},B={(湖北,武汉),(广东,广州),(广东,深圳),(陕西,西安)},求A∪B、A∩B、A-B。显然,A、B是表示城市和所在省的关系。A∪B={(湖南,长沙),(河北,石家庄),(陕西,西安),(湖北,武汉),(广东,广州),(广东,深圳)}A∩B={(陕西,西安)}A-B={(湖南,长沙),(河北,石家庄)}12122.2关系代数的基本原理4.连接设A是一个包含m个元组的k1元关系,B是一个包含n个元组的k2元关系,则A、B的连接是一个包含m×n个元组的k1+k2元关系,记作A×B。5.投影设R=R(A1,A2,…,An)是一个n元关系,{i1,i2,…,im}是{1,2,…,n}的一个子集,并且i1i2…im,定义:称π(R)是R在上的一个投影。6.选择设R={(a1,a2,…,an)}是一个n元关系,S是关于(a1,a2,…,an)的一个条件,R中所有满足S条件的元组组成的子关系S(R),称为R的一个选择。),,,()(21miiiAAAR13132.2关系代数的基本原理例2-2设R1=R1(姓名,性别)={(钱达理,男),(东方牧,男)},R2=R2(所在单位,住址)={(总经理办,东风路78号),(销售部,五一北路25号)},求(1)R=R1×R2。(2)R在(姓名,所在单位,住址)的投影。(3)根据表2-1,求R关系的一个选择。解:(1)R={(钱达理,男,总经理办,东风路78号),(钱达理,男,销售部,五一北路25号),(东方牧,男,总经理办,东风路78号),(东方牧,男,销售部,五一北路25号)}。R是一个包含4个元组的4元关系。(2)根据投影的定义,只需对上面得到的R关系的每个元组删掉性别属性即可,所以π(R)={(钱达理,总经理办,东风路78号),(钱达理,销售部,五一北路25号),(东方牧,总经理办,东风路78号),(东方牧,销售部,五一北路25号)}(3)根据表2-1,钱达理是总经理办的,住在东风路78号,东方牧也是总经理办的,住在五一北路25号,R关系中只有一个元组反映的情况正确,其余元组数据错误,应删掉,根据该条件(即符合表2-1的描述)所得到的一个选择是:R(S)={(钱达理,总经理办,东风路78号)}14142.3关系模式的分解引例:表2-2关系模型存在如下3方面的问题。插入异常删除异常数据冗余与更新异常供应商代码供应商名称联系人商品名称订货数量单价S001华科电子有限公司施宾彬笔记本计算机109800.00S001华科电子有限公司施宾彬激光打印机52800.00S002湘江计算机外设公司方胜力笔记本计算机510200.00S003韦力电子实业公司周昌喷墨打印机5480.00S003韦力电子实业公司周昌交换机28500.00表2-2一个不好的关系模式15152.3关系模式的分解要解决上述3个问题,需要把表2-2进行分解,表中前3列独立建立一个表,指定供应商代码作为关键字,并删除相同的行;后3列独立,引入供应商代码列作为外键,并增加一个订货日期列,供应商代码和订货日期的组合作为第2个表的关键字。经过这样处理后,上述异常问题就完全解决了。16162.3关系模式的分解函数依赖的基本概念定义1设R=R(A1,A2,…,An)是一个关系模式(A1,A2,…,An是R的属性),X∈{A1,A2,…,An},Y∈{A1,A2,…,An},即X和Y是R的属性子集,T1、T2是R的两个任意元组,即T1=T1(A1,A2,…,An),T2=T2(A1,A2,…,An),如果当T1(X)=T2(X)成立时,总有T1(Y)=T2(Y),则称X决定Y,或称Y函数依赖于X。记为:X→Y。17172.3关系模式的分解定义2R,X,Y如定义1所设,如果X→Y成立,但对X的任意真子集X1,都有X1→Y不成立,称Y完全函数依赖于X,否则,称Y部分函数依赖于X。定义3设X,Y,Z是关系模式R的不同属性集,若X→Y(并且Y→X不成立),Y→Z,称X传递决定Z,或称Z传递函数依赖于X。18182.3关系模式的分解关系的规范化1.主属性与非主属性候选关键属性和关键属性定义4设关系模式R(A1,A2,…,An),A1,A2,…,An是R的属性,X是R的一个属性集,如果① X→(A1,A2,…,An),② 对于X的任意真子集X1,X1→(A1,A2,…,An)都不成立,则称属性集X是关系模式R的一个候选关键属性。如果关系模式R只有一个候选关键属性,称这惟一的候选关键属性为关键属性,否则,应从多个候选关键属性中指定一个作为关键属性。习惯上把候选关键属性称为候选关键字,关键属性称为关键字。主属性和非主属性定义5设Ai是关系模式R的一个属性,若Ai属于R的某个候选关键属性,称Ai是R的主属性,否则,称Ai为非主属性。19192.3关系模式的分解2.第1范式对关系模式的规范化要求分成从低到高不同的层次,分别称为第1范式、第2范式、第3范式、Boyce-Codd范式、第4范式和第5范式。定义6当关系模式R的所有属性都不能分解为更基本的数据单位时,称R是满足第1范式的,简记为1NF。例如,如果关于员工的关系中有一个工资属性,而工资又由更基本的两个数据项基本工资和岗位工资组成,则这个员工的关系模式就不满足1NF。20202.3关系模式的分解3.第2范式定义7如果关系模式R满足第1范式,并且R的所有非主属性都完全依赖于R的每一个候选关键属性,称R满足第2范式,简记为2NF。4.第3范式定义8设R是一个满足第1范式条件的关系模式,X是R的任意属性集,如果X非传递依赖于R的任意一个候选关键字,称R满足第3范式,简记为3NF。定理若关系模式R符合3NF条件,则R一定符合2NF条件。21212.3关系模式的分解5.Boyce-Codd范式定义9设R是一个关系模式,若R的每一个函数依赖关系的左部都是R的一个候选关键字,称R满足Boyce-Codd范式,简记为BCNF。可以证明,BCNF是比3NF更强的规范(证明略),即符合BCNF条件的关系模式一定符合3NF条件,但反过来却不成立。22222.3关系模式的分解关系的分解1.关系模式分解的一般问题所谓关系模式的分解,就是对原有关系在不同的属性上进行投影,从而将原有关系分解为两个或两个以上的含有较少属性的多个关系。2.3NF分解(1)如果R不满足1NF条件,先对其分解,使其满足1NF。对R进行1NF分解的方法不是采用投影,而是直接将其复合属性进行分解,用分解后的基本属性集取代原来的属性,以获得1NF。23232.3关系模式的分解例2-3将R(员工号,姓名,工资)进行分解,使其满足1NF条件。假定R的工资属性由基本工资和岗位工资组成,直接用属性集(基本工资,岗位工资)取代工资属性,得到新关系R_NEW(员工号,姓名,基本工资,岗位工资),R_NEW满足1NF。(2)R符合1NF条件但不符合2NF条件时,分解R使其满足2NF。24242.4关系模型的完整性约束实体完整性所谓实体完整性,就是一个关系模型中的所有元组都是惟一的,没有两个完全相同的元组,也就是一个二维表中没有两个完全相同行,也称为行完整性。域完整性域完整性就是对表中列数据的规范,也称列完整性,用于限制列的数据类型、格式以及取值范围。参照完整性当一个数据表中有外部关键字(即该列是另外一个表的关键字)时,外部关键字列的所有值,都必须出现在其所对应的表中,这就是参照完整性的含义。用户定义完整性25252.5数据库的设计方法数据库设计过程数据库设计过程一般包括:(1)需求分析(2)概念设计(3)逻辑设计(4)物理设计(5)实施与维护26262.5数据库的设计方法E-R模型及其到关系模型的转化E-R模型关系模型对问题进行分析转化图2-2E-R模型到关系模型的转化过程1.独立实体到关系模型的转化一个独立实体转化为一个关系模型(即一张关系表),实体码转化为关系表的关键属性,其他属性转化为关系表的属性,注意根据实际对象属性情况确定关系属性的取值域。27272.5数据库的设计方法例:例如对于图2-3所示的学生实体,应将其转化为关系:学生(学号,姓名,民族,籍贯)其中下划线标注的属性表示关键字。学生学号民族籍贯姓名图2-3学生实体的E-R图28282.5数据库的设计方法2.1:1
本文标题:关系数据库原理
链接地址:https://www.777doc.com/doc-5925790 .html