您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 数据库引论 第2章关系数据库基本原理
第2章关系数据库基本原理1本章内容1.1关系数据库基本原理2.2关系代数的基本原理2.3关系模式的分解2.4关系模型的完整性约束2.5数据库的设计方法22.1关系数据库概述关系数据模型数据模型的任务是描述现实世界中的实体及其联系。关系数据模型就是采用一个有序数组描述实体及其属性,用这种有序数组的集合描述一个实体集合,而采用定义在两个集合上的关系反映不同实体间的联系。部门编号部门名称员工编号员工姓名性别住址D001总经理办E001钱达理男东风路78号D001总经理办E002东方牧男五一北路25号D002市场部E003郭文斌男公司集体宿舍D003销售部E004肖海燕女公司集体宿舍D004仓储部E005张明华男韶山北路55号3表2-1关系模型示例关系数据库基本概念定义:关系数据库就是一些相关的二维表和其他数据库对象的集合。在这个定义中明确,关系数据库中的所有信息都存储在二维表格中;一个关系数据库可能包含多个表;除了这种二维表外,关系数据库还包含一些其他对象,如视图等。42.1关系数据库概述Page5/312.1关系数据库概述关系模型的基本概念:1.关系一个关系就是一张二维表,通常将一个没有重复行、重复列的二维表看成一个关系,每个关系都有一个关系名。2.元组二维表的每一行在关系中称为元组(Tuple)。一行描述了现实世界中的一个实体,或者描述了不同实体间的一种联系。3.属性二维表的每一列在关系中称为属性(Attribute),每个属性都有一个属性名,各个属性的取值称为属性值。每个属性有一定的取值范围,称为值域。4.关键字关系中能惟一区分、确定不同元组的属性或属性组合,称为该关系的一个关键字。关键字又称为键或码(Key)。62.1关系数据库概述5.外部关键字如果关系中某个属性或属性组合并非关键字,但却是另一个关系的主关键字,则称此属性或属性组合为本关系的外部关键字或外键(ForeignKey)。在关系数据库中,用外部关键字表示两个表间的联系。72.1关系数据库概述例:请指出下面两个关系模式的主键以及外键学生(学号,姓名,性别,专业号,年龄)专业(专业号,专业名)Page8/312.1关系数据库概述主键外键主键关系数据库基本特征有坚实的理论基础数据结构简单、易于理解对用户提供了较全面的操作支持得到了众多开发商的支持92.1关系数据库概述2.2关系代数的基本原理关系的数学定义1.集合集合没有严格的形式定义,一般说来,集合是与某一研究过程相关的一类对象的整体,这些对象称为集合的元素。2.元组几个元素组成的一个有序组称为一个元组,通常元组用圆括号括起来的一些元素表示,元素间使用逗号分隔。例如(3,5,6)和(E001,钱达理,男,东风路78号)是元组的例子。在关系数据库中,可以把一个表的每一行看作一个元组。103.集合的笛卡尔乘积设A1、A2、…、An为任意集合,A1、A2、…、An的笛卡尔乘积记做:A1×A2×…×An,并且定义D=A1×A2×…×An={(a1,a2,…,an)|ai∈Ai,i=1,2,…,n},其中(a1,a2,…,an)是一个元组,它的每个元素ai取自对应的集合Ai。例如,设A={1,2},B={a,b},则A×B={(1,a),(1,b),(2,a),(2,b)}。4.关系关系是一个集合,其组成元素是元组而不是组成元组的元素。112.2关系代数的基本原理关系运算:对二维表格进行运算的机制。1.并设A、B同为n元关系,则A、B的并也是一个n元关系,记作A∪B。2.交设A、B同为n元关系,则A、B的交也是一个n元关系,记作A∩B。A∩B包含了所有同属于A、B的元组。3.差设A、B同为n元关系,则A、B的差也是一个n元关系,记作A-B。A-B包含了所有属于A但不属于B的元组。122.2关系代数的基本原理例2-1设A={(湖南,长沙),(河北,石家庄),(陕西,西安)},B={(湖北,武汉),(广东,广州),(广东,深圳),(陕西,西安)},求A∪B、A∩B、A-B。显然,A、B是表示城市和所在省的关系。A∪B={(湖南,长沙),(河北,石家庄),(陕西,西安),(湖北,武汉),(广东,广州),(广东,深圳)}A∩B={(陕西,西安)}A-B={(湖南,长沙),(河北,石家庄)}132.2关系代数的基本原理4.连接设A是一个包含m个元组的k1元关系,B是一个包含n个元组的k2元关系,则A、B的连接是一个包含m×n个元组的k1+k2元关系,记作A×B。5.投影设R=R(A1,A2,…,An)是一个n元关系,{i1,i2,…,im}是{1,2,…,n}的一个子集,并且i1i2…im,定义:称π(R)是R在上的一个投影。6.选择设R={(a1,a2,…,an)}是一个n元关系,S是关于(a1,a2,…,an)的一个条件,R中所有满足S条件的元组组成的子关系S(R),称为R的一个选择。14),,,()(21miiiAAAR2.2关系代数的基本原理例2-2设R1=R1(姓名,性别)={(钱达理,男),(东方牧,男)},R2=R2(所在单位,住址)={(总经理办,东风路78号),(销售部,五一北路25号)},求(1)R=R1×R2。(2)R在(姓名,所在单位,住址)的投影。(3)根据表2-1,求R关系的一个选择。15解:(1)R={(钱达理,男,总经理办,东风路78号),(钱达理,男,销售部,五一北路25号),(东方牧,男,总经理办,东风路78号),(东方牧,男,销售部,五一北路25号)}。(2)π(R)={(钱达理,总经理办,东风路78号),(钱达理,销售部,五一北路25号),(东方牧,总经理办,东风路78号),(东方牧,销售部,五一北路25号)}(3)R(S)={(钱达理,总经理办,东风路78号)}2.2关系代数的基本原理2.3关系模式的分解引例:表2-2关系模型存在如下3方面的问题。插入异常删除异常数据冗余与更新异常供应商代码供应商名称联系人商品名称订货数量单价S001华科电子有限公司施宾彬笔记本计算机109800.00S001华科电子有限公司施宾彬激光打印机52800.00S002湘江计算机外设公司方胜力笔记本计算机510200.00S003韦力电子实业公司周昌喷墨打印机5480.00S003韦力电子实业公司周昌交换机28500.0016表2-2一个不好的关系模式要解决上述3个问题,需要把表2-2进行分解,表中前3列独立建立一个表,指定供应商代码作为关键字,并删除相同的行;后3列独立,引入供应商代码列作为外键,并增加一个订货日期列,供应商代码和订货日期的组合作为第2个表的关键字。经过这样处理后,上述异常问题就完全解决了。172.3关系模式的分解供应商代码供应商名称联系人商品名称订货数量单价S001华科电子有限公司施宾彬笔记本计算机109800.00S001华科电子有限公司施宾彬激光打印机52800.00S002湘江计算机外设公司方胜力笔记本计算机510200.00S003韦力电子实业公司周昌喷墨打印机5480.00S003韦力电子实业公司周昌交换机28500.00函数依赖的基本概念定义1设R=R(A1,A2,…,An)是一个关系模式,X∈{A1,A2,…,An},Y∈{A1,A2,…,An},即X和Y是R的属性子集,T1、T2是R的两个任意元组,即T1=T1(A1,A2,…,An),T2=T2(A1,A2,…,An),如果当T1(X)=T2(X)成立时,总有T1(Y)=T2(Y),则称X决定Y,或称Y函数依赖于X。记为:X→Y。182.3关系模式的分解例:R(U)为Student(sNo,sName,sAge,sDept)选取X={sNo},Y={sAge},Z={sDept}R(X)R(Y)R(Z)结论:X→Y,X→Z,Y→ZPage19/31sNosNamesAgesDeptN0001李婷婷22计算机N0002张力20计算机N0003王娜21中文N0004赵普21英语sNoN0001N0002N0003N0004sAge22202121sDept计算机计算机中文英语定义2R,X,Y如定义1所设,如果X→Y成立,但对X的任意真子集X1,都有X1→Y不成立,称Y完全函数依赖于X,否则,称Y部分函数依赖于X。例:R(sNo,subject,score)如下:sNo→score和subject→score都不成立,在这里单个的属性不能作为决定因素,但属性的组合可以作为决定因素。(sNo,subject)→score,即score完全依赖于(sNo,subject)20sNosubjectscoreN0001计算机文化基础89N0002经济学76N0002音乐赏析90N0003经济学72F例:R(sNo,subject,score)如下:(sNo,name,subject)→score成立(sNo,subject)→score也成立,则称为score部分依赖于(sNo,name,subject)21sNonamesubjectscoreN0001李婷婷计算机文化基础89N0002张力经济学76N0002张力音乐赏析90N0003赵普经济学72定义3设X,Y,Z是关系模式R的不同属性集,若X→Y(并且Y→X不成立),Y→Z,称X传递决定Z,或称Z传递函数依赖于X。例:R(sNo,name,address)如下:sNo→name,name→adress,则sNo→address,即address传递依赖于sNoPage22/31sNonameaddressN0001李婷婷北京市朝阳区N0002张力山东省青岛市N0003王娜四川省重庆市N0004赵普山东省青岛市关系的规范化1.主属性与非主属性候选关键属性和关键属性定义4设关系模式R(A1,A2,…,An),A1,A2,…,An是R的属性,X是R的一个属性集,如果① X→(A1,A2,…,An),② 对于X的任意真子集X1,X1→(A1,A2,…,An)都不成立,则称属性集X是关系模式R的一个候选关键属性。如果关系模式R只有一个候选关键属性,称这惟一的候选关键属性为关键属性,否则,应从多个候选关键属性中指定一个作为关键属性。习惯上把候选关键属性称为候选关键字,关键属性称为关键字。232.3关系模式的分解主属性和非主属性定义5设Ai是关系模式R的一个属性,若Ai属于R的某个候选关键属性,称Ai是R的主属性,否则,称Ai为非主属性。242.3关系模式的分解2.第1范式第1范式、第2范式、第3范式、Boyce-Codd范式、第4范式和第5范式。定义6当关系模式R的所有属性都不能分解为更基本的数据单位时,称R是满足第1范式的,简记为1NF。例如,如果关于员工的关系中有一个工资属性,而工资又由更基本的两个数据项基本工资和岗位工资组成,则这个员工的关系模式就不满足1NF。例如,职工号,姓名,电话号码组成一个表(一个人可能有一个办公电话和手机号)规范为1NF的方法?252.3关系模式的分解例:下表所示的关系R是否满足1NF,如果不满足,如何调整?上表中,高级职称人数不具备原子性,只要将两个数据项拆分,就满足1NFPage26/31系名称高级职称人数教授副教授计算机系57数学系410系名称教授人数副教授人数计算机系57数学系4103.第2范式定义7如果关系模式R满足第1范式,并且R的所有非主属性都完全依赖于R的每一个候选关键属性,称R满足第2范式,简记为2NF。例:选课关系SC1(学号,课程号,成绩,学分)中组合关键字为(学号,课程号)其中的函数依赖有:(学号,课程号)→成绩,(学号,课程号)→学分,课程号→学分因此,不满足2NF.该关系易引发数据冗余,插入异常,更新异常,删除异常272.3关系模式的分解原因:非关键字属性“学分”仅函数依赖于cno,即“学分”部分依赖于(学号,课程号),而不是完全依赖4.第3范式定义8设R是一个满足第1范式条件的关系模式,X是R的任意属性集,如果X非传递依赖于R的任意一个候选关键字,称R满足第3范式,
本文标题:数据库引论 第2章关系数据库基本原理
链接地址:https://www.777doc.com/doc-3261173 .html