您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 61第1章 数据库系统概述
第1章数据库系统概述1.1概述1.1.1数据库技术的基本概念与数据库技术密切相关的基本概念有五个,它们分别是信息、数据、数据库、数据库管理系统和数据库系统1.信息不同的领域对信息有着不同的定义,通常认为,信息是人对现实世界事务存在方式或运动状态的某种认识,是客观事物属性和相互联系特性的表现,反映了客观事物的存在形式和运动状态。2.数据数据是把事件的某些属性规范化后的表现形式,可以被识别,也可以被描述。“数据”的概念包括两个方面:一方面,数据内容是事物特性的反映或描述;另一方面,数据是符号的集合。信息与数据既有区别,又有联系,两者的关系是:数据是信息的载体,信息则是数据内在含义,两者可以相互转换。两者也是抽象与客观的关系:信息是抽象的,不随数据设备所决定的数据表示方式而改变,而数据的表示方式及存在方式却是客观现实的。3.数据库数据库(Database,简称DB)是长期存储在计算机内、有组织的、统一管理的相关数据的集合。数据库能被各种用户共享,可以为多种应用提供服务,数据库不存在有害的或是不必要的冗余,数据间联系紧密但数据的存储独立于使用它的程序。4.数据库管理系统数据库管理系统(DatabaseManagementSystems,简称DBMS)是专门用于管理数据库的计算机系统软件,位于用户与操作系统之间,为用户或应用程序提供访问DB的方法。数据库管理系统能够为数据库提供数据的定义、建立、维护、查询和统计等操纵功能,并完成数据完整性检查、安全性检查、并发控制及数据故障恢复等控制功能。目前国内外比较流行的DBMS有Oracle,DB2,Sybase和SQLServer等。2000年,MicrosoftSQLServer2000投入市场;2005年11月,Microsoft公司又推出了最新一代的数据库产品SQLServer2005。SQLServer是基于客户/服务器(Clinent/Server,C/S)模式的数据库系统,建立在MicrosoftWindowsNT平台上,提供强大的企业数据库管理功能。5.数据库系统数据库系统(DBS)是采用了数据库技术的计算机系统,它能够按照数据库的方式存储和维护数据,并且能够向应用程序提供数据。数据库系统通常由数据库、硬件、软件和人员四个部分组成。1)数据库数据库的体系结构可分为两个部分:一部分是存储应用所需的数据,称为物理数据库部分;一部分是描述部分,描述数据库的各级结构。2)硬件数据库系统建立在计算机系统之上,涉及的硬件资源主要包括CPU、内存和外部存储器等。3)软件软件主要包括操作系统、数据库管理系统和一些开发工具,如带有数据库接口的各种高级语言和应用开发软件等。4)人员人员是指管理、开发、使用数据库系统的所有人员,包括数据库管理员(DBA)、系统分析员、应用程序员和终端用户。1.1.2数据库技术的应用及发展进入20世纪80年代后,数据库技术以前所未有的速度向前发展着,并且与各种新兴学科技术有机结合,衍生出了新一代数据库技术,如分布式数据库技术、工程数据库技术、面向对象数据库技术、人工智能数据库技术、并行数据库技术、模糊数据库技术等都是这方面的实例,并广泛应用于多个领域,如计划统计、数据挖掘、信息决策等。新一代的数据库技术都具备以下几个主要特征。①支持数据管理、对象管理和知识管理。②数据库系统必须保持或者继承原来数据库系统的技术。③数据库系统必须对其他系统开放,支持数据库语言标准,支持标准网络协议,有良好的可移植性、可连接性、可扩展和互操作性。新一代的数据库技术典型代表1.分布式数据库技术2.面向对象数据库技术1.2数据库技术的发展阶段1.2.1人工管理阶段人工管理阶段是指计算机诞生的初期(20世纪50年代中期以前),数据管理在人工管理阶段具有以下几个特点。1.数据不保存2.使用应用程序管理数据3.数据不共享4.数据不具有独立性1.2.2文件系统管理阶段数据管理在文件系统管理阶段中具有以下几个特点。1.数据可以长期保存2.由专门的软件即文件系统管理数据3.数据共享性差,冗余度大4.数据独立性差1.2.3数据库系统管理阶段数据库系统的特点主要体现在以下几个方面。1.数据库中的数据是结构化的。2.具有较高的数据独立性:包括两个方面,数据的物理独立性和数据的逻辑独立性。3.具有较低的数据冗余4.数据控制功能数据库管理系统DBMS应用程序1应用程序2应用程序n数据库…1.3数据库系统的体系结构所有的数据库都需要有一个总体框架,即数据库系统的体系结构。数据库系统的体系结构可以从不同的层次或不同的角度来进行考察。从数据库用户来看,数据库系统的结构分为集中式结构(单用户或主从结构)、分布式结构、客户/服务器结构和并行结构。从数据库管理系统的角度看,数据库系统通常采用三级模式结构:外模式、模式与内模式。1.3.1模式的概念在数据模型中有“型”与“值”的概念。“型”是指对某一类数据的结构和属性的说明,是一个总框。而“值”则是对某个型的具体赋值。例如:(张明,男,22,山东,173)就是一个值,它对应的“型”就是(姓名,性别,年龄,籍贯,身高)。“模式”是数据库中全体数据的逻辑结构和特征的描述,它是对数据模型中型的描述,不涉及具体的值。模式的一个具体的值即是该模式的一个实例。同一个模式可以有很多实例。与实例相比,模式是稳定的,不会经常变动;而由于数据库中的数据是处于不断更新的状态,实例是处在相对变动的情况。模式反映的是数据的结构和数据之间的联系,而实例反映的是数据库某一时刻的状态。目前,多数的数据库管理系统产品在体系结构上通常都具有相同的特征,即采用三级模式结构,并提供二级映像功能。1.3.2三级模式结构数据库的数据模式是由外模式、模式和内模式三级模式构成。1.模式“模式”也称为逻辑模式或概念模式,它是数据库的总框,是对数据库中全体数据的逻辑结构和特性的描述,是所有用户的公共数据视图。2.外模式“外模式”也称为用户模式或子模式,它是对各个用户或程序所涉及到的数据的逻辑结构和数据特征的描述,即数据库用户所看到的和使用的数据库的描述。外模式是数据库系统保证数据库安全性的一个重要手段。每个用户只能看见和访问自身所对应的外模式中的数据,无法看到数据库中其他用户模式所涉及的数据。3.内模式“内模式”也称为存储模式或物理模式,它是对内层数据的物理结构和存储方式的描述,是数据在数据库文件内部的表示方式,它是用设备介质语言来定义的。1.3.3数据库模式的映像数据库系统提供的三级模式对应着数据的三个抽象级别,它们把数据的具体组织留给DBMS管理,使用户能逻辑地、抽象地处理数据,而不需要关心数据在计算机中的具体表示方法和存储方式。为了实现这三个层次上的联系和转换,数据库系统在这三级模式中提供了两层映像:外模式/模式映像、模式/内模式映像。正是在这两层映像机制的帮助下,数据库系统中的数据才具有了较高的逻辑独立性和物理独立性。1.外模式/模式映像外模式描述的是数据的局部逻辑结构,模式描述的是数据的全局逻辑结构。对应于同一个模式可以有多个外模式,而对于每一个外模式,数据库系统都对应一个外模式/模式映像,它定义并保证了外模式与模式之间的对应关系。这些映像定义通常包含在各自的外模式中。应用程序是依据数据的外模式进行编写的,外模式/模式映像可以保证模式的变化不会影响到应用程序的执行,实现了数据与程序的逻辑独立,即数据的逻辑独立性。2.模式/内模式映像数据库中只有一个模式,也只有一个内模式,所以模式/内模式映像是唯一的,它定义了数据库全局逻辑结构与存储结构之间的对应关系。映像定义通常包含在模式描述中。当数据库的存储结构改变时(例如由原来的顺序存储改为链式存储),模式/内模式映像也必须做出相应的改变,使得模式保持不变,保证了数据与程序的物理独立,即数据的物理独立性。同外模式/模式映像一样,模式/内模式映像的调整也是由数据库管理员(DBA)来实现的。数据库的二级映像保证了数据库外模式的稳定性,从而从底层保证了应用程序的稳定性。数据与程序之间的独立性使得数据的存取由数据库管理系统管理,用户不必考虑存取路径等细节,从而简化应用程序的编写,较好地减少了应用程序的维护和修改。1.4数据模型根据数据模型应用的不同目的,数据模型可以分为以下两类。第一类是数据模型独立于任何计算机系统实现的,如实体联系模型,这种模型完全不涉及信息在计算机系统中的表示,只是用来描述某个特定组织所关心的信息结构,主要用于数据库设计,称为概念模型,也称为信息模型。第二类数据模型是直接面向数据库中的数据逻辑结构,主要包括关系、网状、层次、面向对象等模型。这类模型涉及到计算机系统,主要用于数据库管理系统的实现,称为结构数据模型(简称为数据模型)。数据模型有严格的形式定义,以便于机器上的实现,它通常有一组严格定义了语法和语义的语言,用户可以使用它来定义、操纵数据库中的数据。数据模型是现实世界的第二层抽象,是数据库系统的核心和基础。1.4.1现实世界的信息化过程人们从对现实生活中事物特性的认识,到计算机数据的具体表示,要经历三个阶段:现实世界、信息世界和机器世界,如图所示1.4.2概念模型概念模型是对现实世界的抽象反映,它不依赖于具体的计算机系统,是现实世界到机器世界的一个中间层次。概念模型一方面应该具有较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识,另一方面它还应该简单、清晰、易于用户理解。1.概念模型的基本概念在概念模型中主要涉及的概念有(1)实体(ENTITY)(2)属性(ATTRIBUTE)(3)码(KEY)(4)域(DOMAIN)(5)实体型(ENTITYTYPE)(6)实体集(ENTITYSET)(7)联系(RELATIONSHIP)2.实体集之间的联系两个实体集之间的联系有三种,分别是一对一联系、一对多联系、多对多联系。(1)一对一联系(1﹕1)如果对于实体集A中的每一个实体,在实体集B中至多有一个实体与之联系,反之亦然。则称实体集A与实体集B具有一对一联系,记为1:1。(2)一对多联系(1﹕m)如果对于实体集A中的每一个实体,实体集B中有m个实体(m≥0)与之联系;反过来,对于实体集B中的每一个实体,实体集A中却至多有一个实体与之联系,则称实体集A与实体集B具有一对多联系,记为1:m。。(3)多对多联系(m﹕n)。对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系;反过来,对于实体集B中的每一个实体,实体集A中也有m个实体(m≥0)与之联系,则称实体集A与实体集B具有多对多联系,记为m﹕n。实例集之间的联系可以用图形方式进行表示,如图所示。3.实体集内部之间的联系以上讨论的是两个不同的实体集之间的关系。实际上,同一实体集内的各实体之间也具有三种联系,分别是一对一的联系(1:1)、一对多联系(1:m)和多对多联系(m:n)。4.概念模型的表示方法概念模型的表示方法有很多,常用的有实体-联系法、扩充实体-联系法、面向对象模型法和谓词模型法等。其中最为著名也最常用的是P.P.S.Chen于1976年提出的实体-联系方法。该方法用E-R图来描述现实世界的概念模型,描述出的概念模型称为实体联系模型,简称为ER模型。ER模型是一个面向问题的概念模型,即用简单的图形方式(E-R图)描述现实世界中的数据。这种描述不涉及数据在数据库中表示和存取方法,非常接近人的思维方式,是各种数据模型的共同基础。ER模型中提供了表示实体、实体属性和实体间的联系的方法。在E-R图中分别使用长方形、椭圆形和菱形表示实体、属性和联系。如果概念模型中涉及的实体带有较多的属性而使实体联系图不清晰,设计人员可以将实体联系图分成两部分,一部分是实体及其属性图,另一部分是实体及其联系图。1.4.3数据模型及其组成要素数据模型是严格定义的一组概念的集合。这些概念精确地描述了系统的静态特性、动态特性和完整性约束条件,是数据库中用来对现实世界进行抽象的工具,是数据库系统的核心与基础,是描述数据的结构以及定义在其上的操作和约束条件。数据模型通常由数据结构
本文标题:61第1章 数据库系统概述
链接地址:https://www.777doc.com/doc-3087250 .html