您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > 数据库系统原理,复习资料
1.1.1数据、数据库、数据库管理系统、数据库系统⑴数据(Data):描述事物的符号记录。数据与其语义是不可分的。⑵数据库(DataBase,DB)长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。⑶数据库管理系统(DataBaseManagementSystem,DBMS)位于用户与操作系统之间的一层数据管理软件。主要功能包括以下几个方面:a.数据定义功能:数据定义语言(DataDefinitionLanguage,DDL)b.数据操纵功能:数据操纵语言(DataManipulationLanguage,DML)c.数据库的运行管理:统一管理、统—控制,以保证数据的安全性、完整性、多用户对数据的并发使用及发生故障后的系统恢复。d.数据库的建立和维护功能:数据库初始数据的输入、转换功能,重组织、性能监视、分析功能等⑷数据库系统(DataBaseSystem,DBS)指在计算机系统中引入数据库后的系统,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员和用户构成。数据库管理员(DataBaseAdministrator,DBA)1.1.2数据管理技术的产生和发展⑴数据库技术是应数据管理任务的需要而产生的。⑵数据的处理是指对各种数据进行收集、存储、加工和传播的一系列活动的总和。⑶数据管理则是指对数据进行分类、组织、编码、存储、检索和维护,它是数据处理的中心问题。⑷数据管理技术经历了人工管理、文件系统、数据库系统三个阶段。人工管理阶段(20世纪50年代中期以前)特点:a.数据不保存b.应用程序管理数据,数据需要由应用程序自己管理,没有相应的软件系统负责数据的管理工作。应用程序中不仅要规定数据的逻辑结构,而且要设计物理结构,包括存储结构、存取方法、输入方式等。因此程序员负相很重。C.数据不共享:数据是面向应用的,一组数据只能对应一个程序。d.数据不具有独立性数据的逻辑结构或物理结构发生变化后,必须对应用程序做相应的修改。文件系统阶段(50年代后期-60年代中期)特点:a数据可长期保存b由文件系统管理数据相互独立的数据文件;“按文件名访问,按记录进行存取”的管理技术;记录内的结构性而整体无结构;存取方法转换使应用程序与数据之间有了一定的独立性;数据在存储上的改变不一定反映在程序上。c数据共享性差,冗余度大文件仍然是面向应用的;数据的冗余度大;数据的修改和维护困难d数据独立性差不容易扩充;数据与程序之间仍缺乏独立性;是一个无弹性的无结构的数据集合。数据库系统阶段(60年代-)特点:a数据结构化数据结构化是数据库与文件系统的根本区别。文件系统中,尽管其记录内部已有了某些结构,但记录之间没有联系。数据的最小存取单位是记录。数据库系统实现整体数据的结构化,描述数据时不仅要描述数据本身,还要描述数据之间的联系。数据不再针对其一应用,是面向全组织,具有整体的结构化。数据的最小存取单位是数据项。b数据的共享性高,冗余度低,易扩充面向整个系统的数据库系统中的数据可以被多个用户、多个应用共享使用。共享导致数据冗余度低,同时可避免数据之间的不相容性与不一致性。容易增加新的应用,这就使得数据库系统弹性大,易于扩充。c数据独立性高物理独立性是指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。也就是说,数据在磁盘上的数据库中怎样存储是由DBMS管理的、用户程序不需要了解,应用程序要处理的只是数据的逻辑结构,这样当数据的物理存储改变了,应用程序不用改变。逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的,也就是说,数据的逻辑结构改变了,用户程序也可以不变。数据独立性是由DBMS的二级映象功能来保证的。d数据由DBMS统一管理和控制数据库的共享是并发的(Concurrency)。DBMS还必须提供的数据控制功能:(1)数据的安全性(Security)(2)数据的完整性(Integrity)正确性、有效性和相容性(3)并发(Concurrency)控制(4)数据库恢复(Recovery)数据库技术的发展是沿着数据模型的主线展开的。数据模型是现实世界数据特征的抽象。数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。通俗地讲数据模型就是现实世界的模拟。数据模型应满足三方面要求:一是能比较真实地模拟现实世界;二是容易为人所理解;三是便于在计算机上实现。根据应用的不同目的,数据模型划分为两类:概念模型(信息模型)按用户的观点来对数据和信息建模;主要用于数据库设计。数据模型按计算机系统的观点对数据建模;主要包括网状模型、层次模型、关系模型等,主要用于DBMS的实现。1.2.1数据模型的三个要素1.数据结构是所研究的对象类型的集合。与数据类型、内容、性质有关的对象(例如网状模型中的数据项、记录,关系模型中的域、属性、关系等)。与数据之间联系有关的对象(例如网状模型中的系型)。数据结构是对系统静态特性的描述。数据结构是刻画一个数据模型性质最重要的方面。2.数据操作是指对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则。数据库主要有检索和更新(包括插入、删除、修改)两大类操作。数据操作是对系统动态特性的描述3.数据的约束条件是一组完整性规则的集合。完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。1.信息世界中的基本概念(1)实体(Entity)客观存在并可相互区别的事物称为实体。(2)属性(Attribute)实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。(3)码(Key)唯一标识实体的属性集称为码。(4)域(Domain)属性的取值范围称为该属性的域。(5)实体型(EntityType)用实体名及其属性集合来抽象和刻画同类实体,称为实体型。(6)实体集(EntitySet)同型实体的集合称为实体集。(7)联系(Relationship)在现实世界中,事物内部以及事物之间是有联系的,这些联系在信息世界中反映为实体(型)内部的联系和实体(型)之间的联系。实体内部的联系通常是指组成实体的各属性之间的联系。实体之间的联系通常是指不同实体集之间的联系。两个实体型之间的联系可以分为三类:一对一联系(1:1),如“班级-班长”一对多联系(1:n),如“班级-学生”多对多联系(m:n),如“课程-学生”1.2.2数据模型数据库领域中最常用的数据模型有四种层次模型(HierarchicalModel),如IBM的IMS系统网状模型(NetworkModel),如DBTG系统关系模型(RelationalModel),如Oracle,Sybase面向对象模型(ObjectOrientedModel)模式(schema):是数据库中全体数据的逻辑结构和特征的描述,它仅仅涉及到型的描述,不涉及到具体的值。模式的一个具体值称为模式的一个实例(instance)。同一个模式可以有很多实例;模式是相对稳定的,而实例是相对变动的;模式反映的是数据的结构及其联系,而实例反映的是数据库某一时刻的状态。不同的DBMS在体系结构上通常都具有相同的特征,即采用三级模式结构并提供两级映象功能。模式(Schema)也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。它是数据库系统模式结构的中间层模式实际上是数据库数据在逻辑级上的视图。一个数据库只有一个模式。数据库模式以某一种数据模型为基础,统一综合地考虑了所有用户的需求,并将这些需求有机地结合成一个逻辑整体。模式定义包括数据的逻辑结构定义、数据之间的联系定义以及安全性、完整性要求的定义。DBMS提供模式定义语言(模式DDL)来严格地定义模式。外模式(ExternalSchema)也称子模式(Subshema)或用户模式,它是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。外模式通常是模式的子集。一个数据库可以有多个外模式。外模式是保证数据库安全性的一个有力措施。DBMS提供子模式定义语言(子模式DDL)来严格地定义子模式。内模式(InternalSchema)也称存储模式(Storageschema),一个数据库只有一个内模式。它是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。例如,记录的存储方式是顺序存储、按照B树结构存储还是按hash方法存储;索引按照什么方式组织;数据是否压缩存储,是否加密;数据的存储记录结构有何规定等。DBMS提供内模式描述语言(内模式DDL,或者存储模式DDL)来严格地定义内模式。优点:数据库的二级映象保证了数据库外模式的稳定性,从而从底层保证了应用程序的稳定性。数据和程序之间的独立性使得数据的定义和描述可以从应用程序中分离出去。另外,由于数据的存取由DBMS管理,用户不必考虑存取路径等细节,从而简化了应用程序的编制,大大减少了应用程序的维护和修改。层次数据模型的优缺点优点:很少几条命令就能操纵数据库,使用简单;对于实体间联系是固定的,且预先定义好的应用系统,采用层次模型性能优于关系模型;良好的完整性支持;缺点:对于多对多联系,通过引入冗余数据解决;对插入和删除操作限制多;查询子女结点必须通过双亲结点;网状数据模型的优缺点优点:能够更为直接地描述现实世界;具有良好的性能,存取效率较高;缺点:其DDL(数据定义语言)语言极其复杂;数据独立性差;关系数据库的优缺点优点:建立在严格的数学概念的基础上的;关系模型的概念单一;关系模型的存取路径对用户透明,数据独立性高,安全保密性好;缺点:查询效率不如非关系数据模型;数据库管理系统它是数据库系统的核心,是为数据库建立、使用和维护而配置的软件;建立在操作系统的基础上,位于操作系统与用户之间的一层数据管理软件;负责对数据进行同一的管理和控制;DBMS的功能数据定义;数据操纵;数据库运行管理;数据组织、存储和管理;数据库的建立和维护;数据通道接口;DBMS的组成:数据定义语言及其翻译处理程序;数据操纵语言及其编译(或解释)程序;数据库运行控制程序;实用程序1:实体:客观存在并可相互区别的事物。2:模式:数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。3:候选码:关系中能唯一地标识一个元组的属性或属性组。4:函数依赖:设R(U)是属性集U上的关系模式,X,Y是U的子集,若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称X函数决定Y或Y函数依赖于X,记为XY。5:事务:用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单位。1:数据库系统的特点:数据结构化,数据共享性高、冗余度低、易扩充,数据独立性高,数据由DBMS统一管理和控制。2:查询优化的一般准则:①选择运算应尽可能先做。②在执行连接前对关系适当地预处理。③把投影运算和选择运算同时进行④把投影同其前或其后的双目运算结合起来。⑤把某些选择同在它前面要执行的笛卡尔积结合起来成为一个连接运算。⑥找出公共子表达式。3:数据库设计的特点:数据库建设是硬件、软件、干件的结合,把结构设计和行为设计密切结合起来。4:事务的四个特性:原子性、一致性、隔离性和持续性。1.数据库数据具有__永久存储有组织和可共享_三个基本特点。2.试述数据、数据库、数据库系统、数据库管理系统的概念。数据:描述事物的符号记录称为数据。数据的种类有文字、图形、图象、声音、正文等等。数据与其语义是不可分的。数据库:数据库是长期储存在计算机内、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。数据库系统:数据库系统(DBS)是指在计算机系统中引入数据库后的系
本文标题:数据库系统原理,复习资料
链接地址:https://www.777doc.com/doc-3205469 .html