您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第1章数据库系统导论.
——数据库应用教程本章主要内容数据管理技术的发展数据处理及数据管理的概念数据模型数据库系统组成数据库系统体系结构主要内容数据库管理系统的组成数据库管理系统的组成1.1数据处理概念1.1.1数据与信息1.数据从本质上说,数据是指描述事物的符号,可以有多种形式。数字、文字、图形、图像、动画、声音、影像等都是数据。2.信息信息是现实世界中的各种事物、事物的特征及其联系等在人脑中的反映,是经过处理、加工提炼而用于决策制定或其他应用活动的数据。对信息可以从两个方面来理解,一方面信息是数据的含义;另一方面信息是经过处理的数据。3.数据与信息的关系信息和数据是两个既有联系又有区别的概念,数据是信息的载体,信息是数据的内涵。同一信息可以有不同的数据表示形式,而同一数据也可能有不同的解释。1.1数据处理概念1.1.2数据处理与数据管理1.数据处理从已有的数据出发,根据事物之间的联系,经过一定的处理步骤,就可以产生出新的数据。这新的数据又表示了新的信息,通常用来作为决策的依据,这种从已知的、原始的或杂乱无章中的数据中推导出对人们有用的数据或信息的过程称为数据处理。2.数据处理核心数据处理核心不是数据计算,而是数据管理。例:某手机生产厂家的总经理,希望知道本厂高、中、低各档次手机的市场占有率。3.数据管理数据管理是指数据的收集、整理、组织、存储、传送、查询等各种操作,是数据处理的基本环节,是任何数据处理任务的共性部分。数据库技术就是一门数据管理技术。1.人工管理阶段2.文件系统阶段3.数据库系统阶段1.2数据管理技术的发展1.2数据管理技术的发展1.2.1人工管理阶段1.时间20世纪50年代中期以前。计算机提供给人们的只有简单的硬件系统,外存也只有纸带、磁带和卡片,软件上还没有出现操作系统。3.特点程序员在进行数据处理时,不但要设计数据的表现形式(用户看到的),而且还要设计数据的物理存放形式及输入、输出方式。2.硬软件此时尚没有文件的概念,即使有也只是简单的顺序文件,故没有数据文件的说法。一组数据对应一个应用程序,程序和数据组基本上是绑在一起的。1.2数据管理技术的发展1.2.1人工管理阶段缺点:人工管理方式是面向某一具体应用的,程序和数据组基本上是绑在一起的,因此数据的独立性差,无法实现数据共享,数据冗余度(同样的数据出现多次称为冗余)大。1.2数据管理技术的发展1.2.2文件系统阶段1.时间20世纪60-70年代,计算机大量用于管理领域。在硬件方面出现了磁盘、磁鼓等直接存取的存储设备,在软件方面出现了简单的数据文件管理系统(文件系统)。文件系统专门管理文件,用户对数据文件的存取都通过文件系统来进行的。2.硬软件程序员在编程时不必考虑数据的存放形式,用户存取数据只需通过应用程序与文件管理系统之间的接口来进行。1.2数据管理技术的发展1.2.2文件系统阶段1.2数据管理技术的发展1.2.2文件系统阶段1.特点辅助存储器成为计算机系统不可缺少的组成部分,用来存放数据文件。由文件系统对驻留在外存储器上的数据文件实施统一管理。应用程序不再需要了解数据在存储介质上的实际地址及存放形式,从而大大减少了程序员的工作量。除了顺序文件外,还出现了类似了索引文件等的直接存取文件。数据文件可能重复利用,不再与某个应用程序绑在一起。如在图1-2中,“应用程序2”通过某种存取方法可以存取“数据文件1”~“数据文件N”中的任一数据文件。说明:文件系统的出现使数据管理技术走上了一个新的台阶,但是文件结构的设计依然是基于特定用途的,数据文件与程序之间的依赖关系并没有根本改变,因此它的缺陷依然存在。数据冗余无法避免面向应用,文件结构难以扩展1.2数据管理技术的发展1.2.2文件系统阶段2.优点实现了数据的文件级共享。程序和数据文件相互依存。数据冗余大、数据的不一致性。3.缺点不能反映企业间的业务联系。4.改进为了更方便地实现各用户对数据的共享,实现数据和程序的独立性,就进入了数据处理的第三阶段——数据库系统阶段。1.2数据管理技术的发展1.2.3数据库系统阶段1.数据库技术的目标一是克服程序和文件的相互依存。二是重在表现数据之间的联系。三是尽量克服数据冗余,解决数据的安全性和完整性保护问题。2.与文件系统的根本区别数据库系统是面向整个系统的,而文件系统是面向具体应用的。即数据库把一个机构中公用的数据综合在一起,放在一个公用的数据库中,并将各项的数据按照一定的逻辑结构构造在一起,使数据不仅存在于数据库中,而且还能反映出各类数据之间的复杂关系。说明:由于各部门公用的数据存放在一个公共的数据库中,数据一般只有一个版本,从而尽可能地消除了数据冗余。但实际上数据冗余是不可能完全消除了,有时为了应用上的方便,还必须人为是增加数据冗余。1.2数据管理技术的发展1.2.3数据库系统阶段3.数据库系统阶段的主要特点(1)数据的结构化数据库系统中的数据面向整个机构的全局应用,并采用一定的数据模型来进行描述和定义,数据具有整体结构化的特征。在描述数据结构的同时,不但要描述数据的本身,同时还要描述数据之间的联系。由于是从全局分析和描述数据,从而可以使数据可以被机构内的多个用户、多个应用所共享。由此可以显著地减少数据冗余,节省存储空间。由于数据没有其它副本,故不会出现数据的不一致性。(2)数据共享性除了共享的数据外,各部门还可以有自己的私有数据,这些数据也可以存放在数据库中,但它只是私有于某个部门,为了防止其它部门对它进行访问,可加上各种保密限制,禁止非法获得这些数据。1.2数据管理技术的发展1.2.3数据库系统阶段3.数据库系统阶段的主要特点(3)数据与程序具有独立性所谓数据独立性是指数据发生变化而应用程序可以不变。数据的独立性包括数据的物理独立性和数据的逻辑独立性。数据的物理独立性是指用户的应用程序与数据库的存储结构相互独立,数据的存储结构发生变化,应用程序可以不变。数据的逻辑独立性是指用户的应用程序与数据库的逻辑结构相互独立,数据的逻辑结构发生变化,应用程序可以不变。数据独立性的实现方法:两层映射。1.2数据管理技术的发展1.2.3数据库系统阶段(4)便于对数据实现集中统一的管理与控制安全性控制完整性控制并发控制故障恢复3.数据库系统阶段的主要特点1.2数据管理技术的发展1.2.3数据库系统阶段(4)便于对数据实现集中统一的管理与控制安全性控制:数据的安全性是指保护数据以防止不合法的使用所造成的数据泄密或破坏。系统一般用检查口令或其它手段来验证用户身份,只有合法用户才能进入数据库系统;可以通过定义保密级别和数据存取权限来控制进入系统的用户只能使用允许他使用的数据。3.数据库系统阶段的主要特点1.2数据管理技术的发展1.2.3数据库系统阶段(4)便于对数据实现集中统一的管理与控制完整性控制:数据的完整性是指数据的正确性、有效性。数据库中的数据是对客观世界中事物性质的反映,必须要符合一定的语义。数据库系统应提供必要的功能,保证数据库中的数据在输入、修改过程中始终符合原来的含义或规定。3.数据库系统阶段的主要特点1.2数据管理技术的发展1.2.3数据库系统阶段(4)便于对数据实现集中统一的管理与控制并发控制:当多个用户的应用程序同时存取、修改数据库时,可能会发生相互干扰而得到错误的结果,并使数据库的完整性受到破坏,因此必须对多用户的并发存取操作加以控制和协调。3.数据库系统阶段的主要特点1.2数据管理技术的发展1.2.3数据库系统阶段(4)便于对数据实现集中统一的管理与控制故障恢复:虽然我们希望数据库中的数据总是正确的、可靠的,但计算机系统故障却是无法保证不出现的。故障出现时,可能会影响到数据库中数据的正确性与有效性,甚至会破坏整个数据库,使数据库中的数据部分或全部丢失。当发生这种情况时,系统应该能够根据故障类型把数据库恢复到正确状态。3.数据库系统阶段的主要特点1.3数据模型1.3.1数据模型的基本概念1.数据模型的概念在数据库系统中,一般使用数据模型来对现实世界和信息世界进行抽象,最后形成能被计算机处理的数据世界。也就是说,数据模型是数据库系统中用于数据及其联系表示和操作的一组概念和定义,各种数据库产品都是基于某种数据模型的。2.三个世界要把现实世界中客观存在的事物及其联系最终反映到计算机的数据世界,要经历三个领域的演变,这三个领域分别是:现实世界、信息世界和数据世界。1.3数据模型1.3.1数据模型的基本概念3.数据模型分类根据数据模型抽象的层次不同,可以把数据模型分成两大类:概念数据模型和实施数据模型。通过概念数据模型,可以把现实世界抽象成人脑中的信息世界,实现数据的第一次抽象。通过实施数据模型把以把信息世界抽象成计算机能够处理的数据世界,实现数据的第二次抽象。1.3数据模型1.3.2信息世界的术语1.实体实体是指客观存在并可相互区分的事物,不但指人和物,而且事件、抽象的状态和概念也可以看作实体。如机房里的一台电脑、计算机应用专业的一名学生、信用卡上的一笔存款、某次考勤对某人的一次记录等都是实体。2.属性实体一般具有若干用来描述其性质的特征,这种特征称之为实体的属性。如某学生的特征可由学号、姓名、出生日期、性别、年级、主修专业、籍贯等属性组成。这些属性中的每一个属性取某一个具体值就是某一个具体的学生描述。1.3数据模型1.3.2信息世界的术语3.实体集有相同类特征的实体集合称为实体集。在一个单位中,具有共性的一类实体可以组合成一个实体集。如在一所院校中,所有教师组成一个教师实体集,所有学生组成一个学生实体集,所有的课程组成一个课程实体集,所有的班级组成班级实体集。4.联系客观世界中的事物不是孤立的,而是有关联的。反映在概念模型中就是实体集之间的联系。如教师实体集与学生实体集之间的联系是教师教学生。实体集之间的联系是各种各样的,根据联系的特点可将其分成三种基本类型:一对一的联系、一对多的联系和多对多的联系。1.3数据模型1.3.2信息世界的术语4.联系一对一的联系:若对于实体集A中的每一个实体,实体集B中至多有一个实体与之联系,反之亦然,则称实体集A和实体集B之间存在一对一的联系,记作1:1的联系。如系主任实体集和系实体集的联系,就是1:1的联系。一对多的联系:若对于实体集A中的每一个实体,实体集B中有n(n≥0)个实体与之联系,而对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A和实体集B之间存在一对多的联系,记录1:n的联系。如班级实体集与学生实体集之间的联系就是1:n的联系。多对多的联系:若对于实体集A中的每一个实体,实体集B中有n(n≥0)个实体与之联系,而对于实体集B中的每一个实体,实体集A中也有m(m≥0)个实体与之联系,则称实体集A和实体集B之间存在多对多的联系,记录m:n的联系。如学生实体集与课程实体集之间的联系。1.3数据模型1.3.2信息世界的术语5.关键字实体集中的实体是可以相互区分开来的,因此实体集中一定存在这样的属性或属性组,它(它们)的值能够惟一标识实体集中的每一个实体,该属性或属性的组合就称为该实体集的关键字(或键)。通常情况下,一个实体集的关键字有很多,可选出一个作为主关键字。实体集的属性总是在一定范围内取值,这种属性的取值范围称为值域。6.值域1.3数据模型1.3.3四大数据模型把信息世界中的实体及其联系转化为数据库中的数据,需要借助于实施数据模型(一般简称数据模型)这个工具。数据模型是数据库中用于提供信息表示和操作手段的形式框架,是将信息世界转化为数据世界的桥梁。目前常用的数据模型有层次模型、网状模型、关系模型和面向对象数据模型四大类。层次数据模型是三大经典数据模型中出现最早的一个,它用树型结构来表示实体集与实体集间的联系。树中的节点,表示实体集,树中的连线用来表示实体集间的联系,这种联系只能是1:1或1:n的联系。1.层次模型层次模型是指满足下列条件的基本层次联系的集合:(1)有且仅有一个节点无父结点,此结点称为根结点;(2)根结点以外的其它结点有且仅有一个父结点。层次模型的优点是层次分明,结构清
本文标题:第1章数据库系统导论.
链接地址:https://www.777doc.com/doc-2154121 .html