您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第1章数据库系统原理绪论.
数据库原理与应用主讲:蔡莉华课程性质计算机类学科专业基础课学时计划64=40+24课程考核30%考勤+实验70%期末测验1.1数据库系统概论•数据库技术在软件行业的重要地位,是信息系统核心和基础。•应用广泛(应用领域极其广泛,渗透到各行各业,人们生活中不可缺少的一个部分)•数据库课程在本专业课程体系中的重要地位基本术语介绍:数据,数据库,数据库管理系统,数据库系统。主要概念介绍:关系模型,数据模型三要素,三层模式和二级映像体系结构及意义。需了解的内容介绍:数据管理的三个阶段,层次模型,网状模型。需掌握的技能:能分析现实环境的概念模型,掌握ER图的画法。本章主要内容1.1.1基本术语•数据数据-数据是描述信息的符号记录,也是数据库研究和处理的基本对象。信息-事物的存在方式或运动状态。数据库中的数据:各种“数字”(数字、图形、图象、声音、字符)(“李明”,“男”,1972-05-12,“计算机系”)•数据库-数据库(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据集合•数据库的特征–数据按一定的数据模型组织、描述和储存–可为各种用户共享–冗余度较小–数据独立性较高–易扩展•数据库管理系统(DBMS)-用户与操作系统间的一层系统软件,常用的有SQLSERVER、Access、FoxPro、Oracle、DB2等数据定义功能(DDL)数据操纵功能(DML)数据库的运行管理数据库的建立和维护其他功能•数据库系统(DBS)-采用了数据库技术的计算机系统DB:由DBMS管理的数据的聚集DBMS:是数据库系统的核心,用户开发的数据库系统是建立在特定的DBMS之上应用系统人员应用系统应用开发工具数据库管理系统操作系统数据库用户用户用户数据库系统数据库管理员图1-1数据库系统1.1.2数据管理技术的产生和发展数据管理:如何对数据进行分类.组织.储存.检索及维护。数据管理的三个阶段:人工管理阶段文件系统阶段数据库系统阶段•数据管理技术的发展动力–应用需求的推动–计算机硬件的发展–计算机软件的发展•人工管理阶段-20世纪50年代中期以前,计算机主要用于科学计算。硬件状况-外存只有纸带、卡片、磁带,没有磁盘等直接存取的存储设备;软件状况-只有汇编语言,没有管理数据的软件;数据处理方式-批处理。其特点是:(1)数据不保存;(2)应用程序管理数据;(3)数据不能共享;(4)数据不具有独立性。应用程序1应用程序2应用程序n数据集1数据集2数据集3……图1-2人工管理阶段应用程序与数据之间的对应关系•文件系统阶段-20世纪50年代后期到60年代中期硬件状况-有了磁盘、磁鼓等直接存取存储设备;软件状况-出现了高级语言和操作系统;处理方式-不仅有了批处理,而且能够联机实时处理。其特点是:(1)数据可以长期保存;(2)由文件系统管理数据(3)数据共享性差,冗余度大;(4)数据独立性差。学生基本信息管理学生选课管理应用程序1应用程序2学生基本信息文件F1课程基本信息文件F2学生选课信息文件F3F1包含学号、姓名、性别、生日、所在系、专业、班级、地址F2包含课程号、课程名、授课学期、学分、课程性质F3包含学号、姓名、课程号、课程名、选课类型、成绩•数据库系统阶段-时间:20世纪60年代末,硬件状况已经有大容量的磁盘;处理方式也是联机实时处理。面向全组织的复杂的数据结构。(数据的结构化是数据库的主要特征,是与文件系统的根本差别。)数据冗余小,易扩充。数据独立性高,包括数据的物理独立性和逻辑独立性。统一的数据控制功能(数据的安全性、完整性、并发控制、数据库恢复)。1.1.3数据库系统的特点数据结构化数据系统“整体”结构化,不再针对某一具体应用,而是面向全组织;不仅数据内部结构化,而且整体结构化,且数据之间存在联系。数据库系统实现整体数据的结构化,是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。学生编号姓名性别年龄系家庭出身籍贯政治面貌学号课程号学期成绩日期学校学历名日期奖惩条目姓名与本人关系详细情况课程号课程名称学生基本记录学生人事记录奖惩情况记录学生学籍记录家庭成员记录学生选课记录课程记录图1-3学校信息管理系统中的学生数据数据共享性高,冗余度低,易扩充•从整体看,数据不再面向某个应用而是面向整个系统,因此数据可以被多个用户,多个应用共享。数据共享可以减少数据冗余,节约存储空间。同时能够避免数据之间的不一致性。•有结构的数据,不仅可以被多个应用共享,而且容易增加新的应用,使得数据库系统弹性大,容易扩充,可以适应各种用户的要求。•数据独立性高数据独立性是数据库领域的一个常用术语,包括数据的物理独立性和数据的逻辑独立性。物理独立性是用户的应用程序与存储在磁盘上的数据库中的数据时相互独立的。逻辑独立性是用户的应用程序与数据库的逻辑结构是相互独立的。数据独立性由DBMS的二级映像功能来保证。•数据由DBMS统一管理和控制数据的安全性保护数据的完整性检查并发控制数据库恢复数据库系统的发展阶段标志•1968:IBM设计了层次数据库系统IMS•1969:CODASYL的DBTG发表了关于网状数据模型的报告,标志着网状数据库系统的产生•1970:IBM的E.F.Codd提出了关系数据模型,奠定了关系数据库理论基础,形成了关系数据库主流•1985:开始研究面向对象数据库技术•1990:M.Stonebraker发表“第三代数据库系统宣言”,提出对象关系数据模型•1998:提出了半结构化数据模型(XML1.0)1.2数据模型数据模型:是人们对现实世界的数据特征的抽象。(真实性.易理解.易实现)要求较真实地模拟现实世界,容易为人理解,便于在计算机上实现。现实世界信息世界机器世界人脑抽象概念模型数据模型转换为1.2.1两类数据模型概念模型按用户的观点对数据建模(独立于计算机)数据模型按计算机的观点对数据建模1.2.2概念模型概念模型的用途–概念模型用于信息世界的建模–是现实世界到机器世界的一个中间层次–是数据库设计的有力工具–数据库设计人员和用户之间进行交流的语言对概念模型的基本要求–较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识–简单、清晰、易于用户理解。1、基本概念(1)实体-客观存在并可以相互区别的事物(2)实体集-同类型实体的集合(3)属性-实体所具有的某一特性(4)键(码)-能唯一标识实体的属性集(5)型与值-用实体名及其属性名来抽象同类实体为型型:学生(学号、姓名、性别)值:(‘94001’,‘张平’,男)(6)值域-属性的取值范围2、两个实体之间的联系(1)一对一:如果实体集A中的每个实体至多和实体集B中一个实体有联系,反之亦然,则称A和B之间的联系是1:1。ABR实体集A实体集B(2)一对多:如果实体集A中的每个实体与实体集B中任意多个实体有联系,而实体集B中的每个实体至多和A中的一个实体有联系,则称A和B之间的联系是1:NABR(3)多对多:如果实体集A中的每个实体与实体集B中任意多个实体有联系,反之亦然,则称A和B之间的联系是M:N,ABR3、两个以上实体型之间的联系一般地,两个以上的实体型之间也存在一对一、一对多和多对多联系。例如:对于课程、教师与参考书,如果一门课程可以有若干个教师讲授,使用若干本参考书,而每一个教师只讲授一门课程,每一本参考书只能供一门课程使用,则课程与(教师,参考书)之间的联系是一对多的。课程教师参考书讲授1mn供应商项目零件供应mnp图1-43个实体型之间的联系示例4、同一实体集内实体之间的联系一对多联系实例职工实体集内部具有领导与被领导的联系:某一职工(干部)“领导”若干名职工,一个职工仅被另外一个职工直接领导,这是一对多的联系。一对一联系多对多联系注意:实体间的联系与现实世界的语义环境关系密切。具体判断时,应根据实际情况分析语义,通过联系的定义来判断联系的类型。“具体问题,具体分析”例如:图书馆借阅管理系统,读者与图书的联系问题。?图书和读者之间的联系问题:某读者当前所借的图书信息?固定某个时间点一位借阅者一次可以借阅多本图书。一本图书一次只能被一位借阅者借阅。在此情况下满足1-N,可以解决该问题。但如果需求涉及“某本书在2003年被哪些借阅者借过”,1-N能否满足?M-N不在特定时间点,考虑长期因素通过考虑借阅时间等因素:一位借阅者可以借阅多本图书一本图书可以借给多位借阅者联系类型应由需求,即现实世界的语义来确定不同角度的不同用户,看问题可能不同,造成冲突4、概念模型表示方法概念模型的表示方法很多实体-联系方法(E-R方法)•用E-R图来描述现实世界的概念模型•E-R方法也称为E-R模型4、概念模型表示方法(续)实体联系模型(E-R图)ER图提供了表示实体型、属性和联系的方法:•实体型:用矩形表示,矩形框内写明实体名。•属性:用椭圆形表示,并用无向边将其与相应的实体型连接•联系:用菱形表示,用无向边将其与相应的实体型连接,同时在无向边旁表上联系的类型(1:1,1:n,m:n)课程教师参考书讲授1mn供应商项目零件供应mnp图3个实体型之间的联系示例职工供应n1图同一实体集中实体之间的联系示例例:为学生成绩管理设计一个E-R模型。主要管理学生及其课程成绩。首先抽象实体型学生(学号、姓名、年龄、性别)课程(课程号、课程名、学分)学生课程学号姓名性别年龄课程号课程名学分成绩选修MN1.2.3数据模型三要素数据结构数据操作完整性约束1.数据结构什么是数据结构•对象类型的集合两类对象•与数据类型、内容、性质有关的对象•与数据之间联系有关的对象数据结构是对系统静态特性的描述2.数据操作数据操作–对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则数据操作的类型–检索–更新(包括插入、删除、修改)数据操作(续)数据模型对操作的定义–操作的确切含义–操作符号–操作规则(如优先级)–实现操作的语言数据操作是对系统动态特性的描述。3.数据的约束条件数据的约束条件–一组完整性规则的集合。–完整性规则是给定的数据模型中数据及其联系所具有的制约和储存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。数据的约束条件(续)数据模型对约束条件的定义–反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。例如在关系模型中,任何关系必须满足实体完整性和参照完整性两个条件。–提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。1.2.4常用的数据模型常用的数据模型非关系模型层次模型(HierarchicalModel)网状模型(NetworkModel)数据结构:以基本层次联系为基本单位基本层次联系:两个记录以及它们之间的一对多(包括一对一)的联系关系模型(RelationalModel)数据结构:表面向对象模型(ObjectOrientedModel)数据结构:对象•层次模型-用树形结构表示实体类型及其联系•层次模型的优缺点:层次模型的数据结构比较简单清晰层次数据库的查询效率比较高层次模型提供了很好的完整性支持表达多对多的联系比较复杂应用程序的编写比较复杂查询子女结点必须通过双亲结点结构严密,层次命令趋于程序化•网状模型-用有向图结构表示实体类型及其联系•网状模型的优缺点:网状能更为直接地描述现实世界性能良好,存取效率高结构比较复杂,随着应用环境的扩大,数据库的结构越来越复杂,不利于最终用户掌握。网状模型的DDL、DML复杂。用户不容易掌握,不容易使用。1.关系模型的数据结构关系模型建立在严格的数学概念的基础上。每个关系的数据结构是一张规范化的二维表。学生登记表学号姓名年令性别系名年级95004王小明19女社会学9595006黄大鹏20男商品学9595008张文斌18女法律学95………………关系:一个关系对应通常所说的一张表元组:表中的一行为一个元组属性:表中的一列即为
本文标题:第1章数据库系统原理绪论.
链接地址:https://www.777doc.com/doc-2154120 .html