您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 数据库原理1 数据库系统概述
参考书目:《数据库系统概论》第三版)萨师煊,王珊高等教育出版社SilberschatzA,KorthHF,SudarshanS.等著杨冬青,唐世渭等译.数据库系统概念(第4版).北京:机械工业出版社,2003.C.J.Date著,孟小峰,王珊等译。数据库系统导论(AnIntroductiontoDatabaseSystems(SeventhEdition)机械工业出版社,2001主要内容第一章:数据库系统概述第二章:关系数据库第三章:关系数据库标准语言SQL第四章:关系系统及其查询优化第五章:关系数据理论第六章:数据库设计第七章:数据库恢复技术第八掌:并发控制第九章:数据库安全性第十章:数据库完整性第十一章:数据库技术新发展与面向对象数据库系统概述《数据库原理》背景知识数据库在软件行业的重要地位多年来在美国等软件业发达国家,各种数据库管理系统(DBMS)的年销售额是仅次于游戏软件的第二大软件,超过各类操作系统的年销售额;在我国各行业中,数据库技术是应用最为广泛的软件技术之一。新技术的发展与数据库的进展密不可分技术数据挖掘商业智能应用(BI)WAP/更广泛无限上网技术801.11802.163G数据库技术的新研究领域数据仓库与数据挖掘P2PXML技术本课程的重要意义和学习方法各行各业中应用最为广泛理论联系实际的学习方法最为有效(上机实践对于课程学习有极为重要的作用)第1章数据库系统概述1.0背景知识数据库技术:研究如何科学地组织和存储数据;如何高效地获取和处理数据。数据库系统具有:1.管理长期应用数据的能力;2.高效地存取大量数据的能力。1.1数据库系统概述1.1.1基本概念数据数据是描述事物的符号记录数据库中的数据:各种“数字”数字、图形、图象、声音、语言数据结构化--记录二.数据库数据库是长期存储在计算机中的,有组织的、大量的、可共享的数据集合永久存储有组织可共享三.数据库管理系统(DBMS)用户与操作系统间的一层系统软件数据定义功能(DDL)数据操纵功能(DML)数据库的运行管理数据库的建立和维护四.数据库系统(DBS)带有数据库的计算机系统DB:由DBMS管理的数据的聚集DBMS:是数据库系统的核心,用户开发的数据库系统是建立在特定的DBMS之上应用系统人员1.1.2数据管理技术的发展两次数据危机20世纪60年代背景:美国陆地卫星,阿波罗计划等。催生了数据库系统。80-90年代。背景:人类基因组计划,web数据大量增加等。促成了数据挖掘技术的产生。数据管理:如何对数据进行分类.组织.储存.检索及维护。数据管理的三个阶段:人工管理阶段文件系统阶段数据库系统阶段一、人工管理阶段•时间:20世纪50年代中期以前•背景:–硬件:外存只有卡片.纸带.磁带–软件:汇编语言–数据批处理•特点:–数据不进行保存–没有专门的数据管理软件–数据面向应用–只有程序的概念二.文件系统阶段•时间:20世纪50年代末到60年代中期•背景:–硬件:磁盘.磁鼓等直接存取的外存设备–软件:操作系统.高级语言.操作系统中的文件系统是专门用于数据管理的软件–文件批处理.联机实时处理•特点:–数据可以长期保存在磁盘上–文件系统提供了数据与程序之间的存取方法–数据冗余度大–文件之间缺乏联系,相互孤立三.数据库系统阶段•时间:20世纪60年代末•背景:–硬件:大容量的磁盘–联机实时处理1.1.3数据库系统的特点面向全组织的复杂的数据结构。(数据的结构化是数据库系统的主要特征,是与文件系统的根本差别。)数据冗余小,易扩充。数据独立性高,包括数据和程序物理独立性和逻辑独立性。统一的数据控制功能(数据的安全性、完整性、并发控制、数据库恢复)。1.1.4数据库技术的发展几个具有代表意义的事件1.1969IBMIMS层次数据库2.60年代末到70年代初的CODASYL下的DBTG网状数据库模型3.1970E.F.Codd.“大型共享数据库数据的关系模型”关系数据库模型4.80年代中期以后,对象-关系模型1.2数据模型•数据模型:是人们对现实世界的数据特征的抽象。(真实性、易理解、易实现)要求较真实地模拟现实世纪,容易为人理解,便于在计算机上实现。两类数据模型概念模型按用户的观点对数据建模数据模型按计算机的观点对数据建模数据模型三要素数据结构数据操作完整性约束1.2.1数据模型的组成要素一.数据结构所研究的对象类型的集合,是对系统静态特性的描述。二.数据操作对数据库仲各种对象(型)和实例(值)运行执行的操作的集合,是对系统动态特性的描述。三.数据的约束条件是一组完整性规则的集合。(应该由DBMS支持,而非应用程序的功能)1.2.2概念模型现实世界到机器世界的中间层次,常用E-R模型表示。一.信息世界的基本概念1.实体。注意:不仅可以是具体的人、事、物,还可以是抽象的概念和联系。2.属性。实体由属性刻划。3.码。注意可以不唯一。反映语义范畴。4.域。属性的取值范围。5.实体型6.实体集7.联系。主要研究不同实体集之间的联系(1)一对一联系。如果对于实体集A中的每一个实体,在实体集B中至多有一个实体与之联系。反之亦然。称实体集A与B具有一对一联系。ABR(2)一对多联系。如果对于实体集A中的每一个实体,在实体集B中有n(n=0)个实体与之相联。反之,实体集B中的每一个实体在实体集A中至多有一个实体与之联系。称实体集A与B具有一对多联系。ABR(3)多对多联系。如果对于实体集A中的每一个实体,在实体集B中有n(n=0)个实体与之相联。反之,实体集B中的每一个实体在实体集A中也有n(n=0)个实体与之联系。称实体集A与B具有多对多联系。ABR实体间的联系与现实世界的语义环境关系密切。具体判断时,应根据分析语义,通过上述定义来判断联系的类型。例如,图书馆借阅管理系统,读者与图书的联系问题。实体间的联系与现实世界的语义环境关系密切。具体判断时,应根据分析语义,通过上述定义来判断联系的类型。“具体问题,具体分析”例如,图书馆借阅管理系统,读者与图书的联系问题。1-N?1-N?一位借阅者一次可以借阅多本图书一本图书一次只能被一位借阅者借阅在此情况下满足1-N,可以解决“某本图书当前是否被借出,被谁所借”之类的问题。1-N?一位借阅者一次可以借阅多本图书一本图书一次只能被一位借阅者借阅在此情况下满足1-N,可以解决“某本图书当前是否被借出,被谁所借”之类的问题。但如果需求涉及“某本书在2012年被哪些借阅者借过”,1-N能否满足?M-N通过考虑借阅时间等因素:一位借阅者可以借阅多本图书一本图书可以借给多位借阅者此联系应该具有联系属性,如“借阅流水号”、“借阅时间”和“归还时间”等此例结论联系类型应由需求,即现实世界的语义来确定不同角度的不同用户,看问题可能不同,造成冲突E-R模型补充除基本联系外,实践中常遇到:Isa联系和弱实体集联系1.实体集及其子类的表示A与B是两个实体集,如果B在具有A所具有的全部属性的基础上有具有自己的属性,及B是A的一个子集。称B为A的子类,A为B的超类(借用面向对象的概念),用isa(属于)联系。学生研究生本科生例如,学生与本科生、研究生的联系:研究生和本科生除了学生的属性外,还各自具有自己的属性。2.弱实体集的表示有两种情况可能形成弱实体集:(1)实体集B是实体集A的组成部分(形成层次结构),B为弱实体集。(2)链接实体是弱实体集。弱实体集联系的特点:(1)弱实体集B到实体A必然是多对一联系。(2)A应为B的码提供自己的码。例如:学院与教研室即是一种层次结构,教研室是弱实体集。如下图所示:学院Unitof教研室二.概念模型的表示方法E-R图实体型:用矩形表示属性:椭圆形表示联系:菱形表示注意:联系本身也可能有属性。思考“图书”作为什么样的实体?思考(续)“图书”——什么样的实体?直接买回,以ISBN作为标识的“图书”实体OR经过处理(如馆藏),以自编号作为标识的“馆藏图书”(或“副本”)实体思考三个实体间的(三个)两两联系与三个实体间的一个联系有何区别?提示:从分别能解决什么样的现实世界具体问题的角度考虑。1.2.3最常用的数据模型层次模型网状模型关系模型面向对象模型(与对象-关系模型有重大差别)基本层次联系是非关模型的基础。1.2.4层次模型(了解即可)以IMS为代表,用树型结构表示实体及实体之间的联系。一.层次模型的数据结构树与森林二.层次模型中多对多联系的表示1.增设冗余节点方法2.虚拟节点方法三.层次模型的数据操纵与完整性约束四.层次模型的存储结构1.邻接法。按从上到下,从左向右的顺序依次存放。2.链接法。子女-兄弟链接法层次序列链接法潜在的意义:在逻辑上与XML有相当类似之处。可能有借鉴作用。五.层次模型的优缺点1.2.5网状模型(简单了解)以DBTG为代表一.数据结构一般的有向联通图实体对应记录实体间的一对多联系对应Set学生课程选课课程学生选课二.网状模型的数据操纵与完整性约束1.支持码的概念2.保证一个联系中双亲记录与子女记录是一对多联系。3.双亲记录与子女记录间满足某些约束条件。三.网状模型的存储结构型与值的区别四.网状模型的优缺点五.与层次模型的比较相同点:1.存取路径表示数据间联系2.用户对数据的存取必须按指定存取路径导航3.数据操作时必须清楚当前位置4.对数据库的操作是一次一记录方式不同点:1.层次模型中从子女到双亲的联系唯一。网状模型不唯一。2.网状模型中允许复合链。1.2.6关系模型概念十分重要一.数据结构关系对应不可分的二维表元组表中的一行即为一个元组属性表中的一列即为一个属性主码表中的某属性组,它可以唯一确定一个元组域属性的取值范围分量元组中的一个属性值关系模式(型)对关系的描述在关系模型中,实体以及实体之间的联系都用关系来表示。二.关系模型的数据操纵与完整性约束一次一集合方式。用户只需指出“Whattodo”,而非关模型中需要告诉系统“Howtodo”。系统的数据独立性比非关模型更高。三.存储结构用户参与较少。(存储参数的调整)四.优缺点1.有严格的数学模型,建立在集合论基础上。2.概念单一,对实体和实体间联系都用关系表示。3.存取路径对用户透明。4.查询效率往往比非关模型低。1.3数据库系统结构两种划分方式:1.从DBMS看:三层2.从用户看:C/SB/S1.3.1数据库系统模式的概念模式与实例的区别型与值静态与动态1.3.2数据库系统的三级模式结构•三层模式:外模式、模式、内模式•二层映象功能:外模式/模式映象和模式/内模式映象•外模式:又称为用户模式,是数据库用户和数据库系统的接口,是数据库用户的数据视图,是数据库用户可以看见和使用的局部数据的逻辑结构和特征的描述。•一个数据库通常都有多个外模式。一个应用程序只能使用一个外模式,但同一外模式可为多个应用程序所用。模式:是所有数据库用户的公共数据视图,是数据库中全部数据的逻辑结构和特征的描述。•一个数据库只有一个模式。模式不但要描述数据库数据的逻辑结构,还要描述数据之间的联系、数据的完整性、安全性要求。内模式:又称为存储模式,是数据库物理结构和存储方式的描述,是数据在数据库内部的表示方式。•一个数据库只有一个内模式。内模式并不涉及物理记录,也不涉及硬件设备。•三层模式关系:数据库模式是数据库的核心和关键,外模式通常是模式的子集。数据按外模式的描述提供用户,按内模式的描述存储在硬盘上,而模式介于外、内模式之间,既不涉及外部的访问,也不涉及内部的存储,从而起到隔离作用,有利于保持数据的独立性,内模式依赖于全局逻辑结构,但可以独立于具体的存储设备。1.3.3二级映象功能与数据独立性映象:是一种对应规则,说明映象双方如何进行转换。三级模式间的两层映象保证数据具有较高的逻辑独立性和物理独立性一.外模式/模式映象(定义在外模式描述中)–作用:把描述局部逻辑结构的外模式与描述全局逻辑结构的模式联系起来。–当模式改变时,只要对外模式/模式映象做相应的改变,使外模式保持不变,则以外模式为
本文标题:数据库原理1 数据库系统概述
链接地址:https://www.777doc.com/doc-4122470 .html