您好,欢迎访问三七文档
-1-目录第1章数据库概述本章介绍数据库的一些基本术语和概念,介绍数据管理的几个阶段,以及关系数据库的一些特点。本章目标:完成本章内容后我们将能够:掌握数据库的术语和概念了解数据管理的几个阶段掌握关系型数据库-2-1.1数据库常用的术语和基本概念(1)数据[Data]:是数据库中存储的基本对象。数据在大多数人头脑中的第一个反映就是数字。其实数字只是最简单的一种数据,是数据的一种传统和狭义的理解。广义的理解,数据的种类很多,例如:文字、图形、图像、声音、学生的档案记录、货运的运输情况等。描述事物的符号记录称为数据。描述事物的符号可以是数字,也可以是文字、图像、图形、声音、语言等,数据有多种表现形式,它们都可以经过数字化后存入计算机。举例:在学生档案中,描述一个学生的一条记录(黎明,男,1988-08-08,江苏,计算机专业,2001-07)这就是数据。(2)数据库[DataBase],简称DB。数据库,顾名思义,是存放数据的仓库。只不过这个仓库是在计算机存储设备上,而且数据是按一定的格式存放的。所谓数据库是指长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。(3)数据库管理系统[DataBaseManagementSystem]简称DBMS如何科学地组织和存储数据,如何高效地获取和维护数据,完成这个任务的是一个系统软件-数据库管理系统。数据库管理系统是位于用户与操作系统之间的一层数据管理软件。数据库管理系统的主要功能:1)数据定义功能:DBMS提供数据定义语言(DataDefinitionLanguage,简称DDL),用户通过它可以方便地对数据库中的数据对象进行定义。2)数据操纵功能:DBMS还提供数据操纵语言(DataManipulationLanguage,简称DML),用户可以使用DML操纵数据实现对数据库的基本操作,如查询、插入、删除和修改等。3)数据库的运行管理:数据库在建立、运用和维护时由数据库管理系统统一管理、-3-目录统一控制,以保证数据的安全性、完整性、多用户对数据地并发使用及发生故障后的系统恢复。4)数据库的建立和维护功能:它包括数据库初始数据的输入、转换功能,数据库的转储、恢复功能,数据库的重组织功能和性能监视、分析功能等。这些功能通常是由一些实用程序完成的。数据库管理系统是数据库系统的一个重要组成部分。(4)数据库系统[DataBaseSystem,简称DBS]数据库系统一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员和用户构成。应当指出的是,数据库的建立、使用和维护等工作只靠一个DBMS远远不够,还要有专门的人员来完成,这些人被称为数据库管理员(DataBaseAdministrator,简称DBA)。数据库系统是指计算机系统中引进了数据库后的系统,其计算机硬件、软件如下图所示。下面用一个实体与数据库系统进行比较,例如数据库系统与图书馆的比较。数据库图书馆数据图书外存书库用户读者数据模型书卡格式数据库管理系统图书馆管理员数据的物理组织方法图书馆图书存放方法用户对数据库的操作读者对图书馆的访问(使用数据操纵语言对数据检索、插入、删除、修改)(用普通语言借书、还书等)-4-1.2数据管理技术的产生和发展数据库技术是应数据管理任务的需要而产生的。数据的处理是指对各种数据进行收集、存储、加工和传播的一系列活动的总和。数据管理则是指对数据进行分类、组织、编码、存储、检索和维护,它是数据处理的中心问题。伴随着计算机技术的不断发展,数据处理及时地应用了这一先进的技术手段,使数据处理的效率和深度大大提高,也促使数据处理和数据管理的技术得到了很大的发展,其发展过程大致经历了人工管理、文件管理、数据库管理及分布式数据库管理等四个阶段。1.2.1数据管理三个阶段比较人工管理阶段文件系统阶段数据库系统阶段时间-50年代中期50年代后期-60年代中期60年代后期—应用背景科学计算科学计算、管理大规模管理硬件背景无直接存取存储设备磁盘、磁鼓大容量磁盘软件背景没有操作系统有操作系统(文件系统)有DBMS处理方式批处理批处理联机实时处理批处理联机实时处理分布处理数据保存方式数据不保存以文件的形式长期保存,但无结构以数据形式保存,有结构数据管理考虑安排数据的物理存储位置与数据文件名打交道对所有数据实行统一、集中、独立的管理数据与程序数据面向程序数据与程序脱离数据与程序脱离实现数据的共享数据的管理者人文件系统DBMS数据面向的对象某一应用程序某一应用程序现实世界数据的共享程度无共享共享性差共享性高-5-目录人工管理阶段文件系统阶段数据库系统阶段数据的冗余度冗余度极大冗余度大冗余度小数据的独立性不独立,完全依赖于程序独立性差具有高度的物理独立性和一定的逻辑独立性数据的结构化无结构记录内有结构整体无结构整体结构化用数据模型描述数据的控制能力应用程序自己控制应用程序自己控制由DBMS提供数据的安全性、完整性、并发控制和恢复能力(1)人工管理阶段该阶段指20世纪60年代以前,这一时期的计算机功能比较简单,主要用于科学计算。计算机外存储设备只有磁带和卡片等,计算机软件系统方面,还没有操作系统,也没有数据库系统等专门的数据管理软件,只有汇编语言。由于缺乏软件系统的支持,数据管理的工作由应用程序完成。在应用程序中不仅要规定数据的逻辑结构,还要设计数据的物理结构。这一阶段数据管理的特点是:不存储数据应用程序所对应的数据不单独存在,在程序运行时由数据卡片或数据磁带输入,运算后直接取走结果,源数据与结果都不保存。不具有数据独立性应用程序完全依赖于数据,不具有数据独立性,一旦数据的逻辑结构或物理结构发生变化,应用程序必须做相应的修改。数据不能共享数据是面向应用的,一个数据集只能对应一个应用程序。应用程序之间不能共享数据。数据大量冗余由于数据不能共享,因此即使两个应用程序使用到某些相同的数据,它们之间也无法相互利用对方的数据。-6-(2)文件管理阶段该阶段指20世纪60年代早期到20世纪60年代后期。在这个时期,计算机开始大量用于非数值计算,磁盘,磁鼓等存储设备的出现大大增强了计算机的存取能力。软件方面,出现了操作系统,数据以文件的形式由操作系统的专门软件——文件管理系统,进行统一管理。其具有以下特点:数据以文件的形式长期保存在计算机中数据统一由操作系统组织成数据文件,并长期保存在磁盘存储器上。用户通过文件管理系统可以方便地进行访问与修改。数据的独立性有一定的提高由于文件的物理组织由操作系统完成,用户或者应用程序只须根据数据的逻辑结构,通过文件名进行访问,无须了解数据的物理结构,从而提高了数据的物理独立性。文件的组织形式多样化文件管理系统还为用户提供了多种文件组织形式,如顺序文件组织,索引文件组织,直接文件存取组织等。文件管理系统的出现,弥补了手工管理的一些缺陷,使得数据管理技术有了很大的提高,但是它在数据管理方面还存在一些不足,主要表现在以下几点:由于数据只能以文件为单位进行共享,不能实现以记录或数据项为单位的共享,因此数据还存在大量的冗余。数据缺乏逻辑独立性,应用程序与数据文件之间仍互相依赖,文件的逻辑结构一旦改变,应用程序也应做相应的修改。文件与文件之间相互对立,无法实现文件之间的相互联系,不能反映客观世界事物间的复杂联系。(3)数据库管理阶段20世纪60年代后期至今,由于计算机技术的迅速发展,磁盘存储技术取得重要进展,计算机更广泛地应用于管理。随着数据量的剧增,对数据管理提出了更高的要求:要求具有更高的独立性与共享性。文件管理技术已经不能适应上述要求。为了进一步减少数据冗余,满足多用户,多应用程序的数据独立与高度共享的需求,使数据为尽可能多的应用程序服务,出现了统一管理数据的专门软件系统——数据库管理系统(database-7-目录managementsystem,DBMS)。其具有以下特点:数据结构化数据库中的数据是按照一定的数据模型建立起来的相关的数据的集合,它既反映现实世界的客观事物,也反映事物之间的联系。数据结构化是数据库系统与文件系统的根本区别。数据独立性高数据库系统提供了数据的逻辑映射与物理映射,这样,数据库中的数据既有逻辑独立性,又有物理独立性。用户只须通过简单的局部逻辑结构来操作数据,无须考虑数据的全局逻辑结构及物理存储结构。因此确保了较高的数据独立性。实现数据的共享与最小冗余数据的共享性直接影响到数据的冗余度。数据库中的数据是面向整个系统,而不是面向某个应用,可以被多个用户共享。这样既可以保证最小的数据冗余,又可以避免数据的不相容性与不一致性。具有统一的数据管理和控制功能数据库系统中由数据库管理系统对数据进行统一的管理和控制。通过DBMS还可以保证数据库系统中数据的安全性,数据的完整性,数据的并发访问控制和数据的恢复。数据库技术在数据管理中的特点与优势,使得它在计算机数据管理中占据主导地位,成为各类信息系统的核心基础。1.2.2分布式数据库分布式数据库系统(DistributedDataBaseSystem,DDBS)是在集中式数据库基础上发展起来的,是数据库技术与计算机网络技术、分布处理技术相结合的产物。分布式数据库系统是地理上分布在计算机网络不同结点,逻辑上属于同一系统的数据库系统,能支持全局应用,同时存取两个或两个以上结点的数据。分布式数据库系统的主要特点是:(1)数据是分布的。数据库中的数据分布在计算机网络的不同结点上,而不是集中在一个结点,区别于数据存放在服务器上由各用户共享的网络数据库系统。(2)数据是逻辑相关的。分布在不同结点的数据,逻辑上属于同一个数据库系统,数据间存在相互关联,区别于由计算机网络连接的多个独立数据库系统。(3)结点的自治性。每个结点都有自己的计算机软、硬件资源、数据库、数据库-8-管理系统(即LocalDataBaseManagementSystem,LDBMS局部数据库管理系统),因而能够独立地管理局部数据库。1.3关系型数据库一个关系型数据库由多个关系组成,每个关系是以二维表的形式组织数据的。1.3.1介绍关系模型中一些术语关系(Relation):一个关系对应通常说的一张表,如上表所示;元组(Tuple):表中的一行即为一个元组;属性(Attribute):表中的一列即为一个属性,给每一个属性起一个名称即属性名。如上表有六列,对应六个属性(学号,姓名,年龄,性别,系和年级);主码(Key):表中的某个属性组,它可以唯一确定一个元组,如上表中的学号,可以唯一确定一个学生,也就称为本关系的主码。域(Domain):属性的取值范围,如人的年龄一般在1~150岁之间,大学生年龄属性的域是(14~38),性别的域是(男,女),系的域是一个学校所有系名的集合;分量:元组中的一个属性值;关系模式:对关系的描述,一般表示为:关系名(属性1,属性2,属性3,…,属性n)-9-目录1.3.2关系型数据库主要特点:一个关系(表)由行与列组成。在关系模式中,能唯一标识元组的属性集称为超键(superkey);如果一个属性能唯一标识元组,且又不含有多余属性,那么这个属性称为候选键(candidatekey);关系模式中用户正在使用的候选键称为主键(primarykey)。列是同质的,即同列所有分量是同类型的元素;用户能检索、查询表里的数据集。用户能把相关的表链接在一起,以便检索存储在不同表中的数据。1.3.3关系数据库中的一个关系的限制关系中没有重复元组,任意元组在关系中都是唯一的元组的顺序无关紧要,即元组的次序可以任意交换。属性的顺序是非排序的,即它的次序可以任意交换。属性必须具有不同的属性名,不同的属性可来自同一个域。同一属性名下的诸属性值(同列)是同类型数据,且来自同一个域。所有的属性值都是原子的1.3.4关系数据库系统的体系结构绝大多数数据库系统在总的体系结构上都具有三级模式的特征。三级模式是对数据的三个抽象级别:(1)外
本文标题:数据库基础教材
链接地址:https://www.777doc.com/doc-3181855 .html