您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据结构与算法 > 第01章 数据库系统简介
LOGO第一章数据库系统简介讲师姓名Contents数据库概述1数据库模型2基本范式3E-R模型41.1数据库概述•数据库技术作为计算机科学的一门分支学科,已经诞生了约30年的历史。现在已经广泛应用于企业和机构,成为其中数据运转不可缺少的中枢。数据库系统到现在经历了多个阶段,发展出了许多新特性,但其中蕴含着的原理和方法并没有太多的改变,这些原理和方法的掌握对于理解数据库应用来说有着非常重要的作用。1.1.1数据库系统的历史•在60年代以前,计算机主要的应用是国防,科学计算等数值计算问题,人们的处理的数据较少,采用文件方式进行处理就能够满足处理数据的需要,到了70年代,随着计算机处理能力的加强和存储容量的提高,使得大量的数据依靠计算机处理变成了可能,这时,处理数据的速度及数据存储的效率变得极其重要,人们开始对如何进一步提高数据使用效率进行研究,这一时间开始出现了DBMS,层次和网状数据库,关系数据库,ER模型,查询语言SQL,查询优化,索引技术,事务管理,OLTP等许多至今还在沿用的技术。1.1.1数据库系统的历史•80年代以来,计算机技术以惊人的速度发展着,计算机以前所未有的速度扩散至地球的每一个角落。存储介质的迅速发展,使得信息存储单位也由字节提升到GB甚至TB,数据的组织和管理也日益严峻地展现在人们面前。如何安全、高效、容易地组织和管理大量的数据,成为了数据库系统必须解决的问题。在这个时期开始出现高级数据模型:扩充关系,对象关系,以及面向应用的研究,数据仓库和数据挖掘等技术。1.1.2数据库系统•数据库系统是指以数据库为基础,能为用户提供数据信息服务的系统。通常它由以下部分组成:•1.计算机及计算机网络•2.数据库和数据库管理系统(DBMS)•3.以前两者为基础的数据库应用程序•计算机和计算机网络构成了数据库系统的硬件部分,即将学习的SQLServer2000就属于一个数据库和数据库管理系统,而在SQLServer2000上开发的一些系统,如股票交易系统或酒店管理系统等就是数据库应用程序。1.1.2数据库系统•图1-1数据库系统示意图在用户终端中装有据库应用程序用来使用户更方便地访问数据库计算机及计算机网络是数据库系统不可缺少的组成部分数据库及数据库系统存放于数据库服务器中Internet1.1.2数据库系统•一个数据库应当系统具有如下特征:•1.数据冗余小:任一数据在数据库系统中应有尽可能少的副本。•2.数据完整:处于需求的数据应完整地包含在数据库系统中。•3.数据集成:数据库系统应将数据对象的各个相关数据整理成一个单独的逻辑数据结构。•4.提供数据共享:数据库系统中多个用户可共享同一数据信息。•5.提供安全控制:对不同的数据库使用者提供不同的数据集合,不支持用户跨集合共享数据,如员工A仅可查看员工A的工资表,而不可查看员工B的工资表。•6.具备数据独立性:数据在数据库中,数据库通过开放数据库接口与应用程序交换信息,这样使应用程序与数据相互分离开来。1.1.3数据库•数据库系统的核心是数据库。•数据库在结构上可以划分为三个层次:物理层、概念层和用户层。•物理层是数据库最核心的层次。它是存储和传输数据的物理设备集合,即物理数据库,物理层由由物理模式(又称为内部模式)描述。•概念层是数据库的逻辑表示,包括数据的逻辑定义以及数据间的逻辑联系。概念层由概念模式定义,这一层也被称为概念模型。•用户层是用户所看到和操作的数据库,是一个或几个特定用户所使用的数据子集,是概念模型的逻辑子集。它的定义由外部模式决定。1.1.4数据的组织结构•在数据库中,数据是现实世界中信息的载体,也是现实世界中信息在数据库中的物理映射。数据的组织按照概念上的从小到大可以分为四级:数据项、记录、文件和数据库。•1.数据项:数据项是数据的最小单位,也称为元素、字段。几个数据项可以组合,构成组合数据项。如SQLServer2000中的“日期时间”可以由日、月、年、时、分、秒六个数据项组合而成。•2.记录:有一定相互关联的数据项组成一个记录,一般一条记录是表示某个现实世界中的实体,如一个公司,一个研究所,一个科研小组等。•3.文件:数据库中的文件中存放了各个记录的值是给定类型的(逻辑)记录的全部具体值的集合。•4.数据库:是比文件更大的数据组织,非空数据库包含一个或一个以上的文件。1.1.5分布式数据库•数据库依据位置的不同分为集中式数据库和分布式数据库。集中式数据库指数据库所有的部分均集中在同一位置。比如,小型企业其服务器均在一个机房内,可以很好地实现数据库服务器的管理,但访问服务器的各客户和处于不同的远程地点访问时,每个客户机将通过远程链路访问,其访问效率将大打折扣。•分布式数据库则指数据库的各个部分分布在不同的位置,这样,若有许多远程客户机访问,它们在大部分情况下可以仅访问处于它们本地的服务器以获得所需的数据。1.2数据模型•数据模型是一种工具,它描述出了人们的信息需求,并将这种需求通过易于数据库系统实现的形式表现出来。简言之,数据模型就是将信息需求抽象化、规范化后形成的一套模型。•数据模型是描述人们的信息需求的,它显然描述了现实世界,它以易于数据库系统实现的形式表现出来,又使得它将成为数据库结构的基础,由此可见,数据模型是沟通现实世界和抽象计算机世界的桥梁。1.2.2数据模型的类型•数据模型应当尽可能地接近现实的信息需求,近30年来,已形成如下几种常见的数据模型。•1.层次结构模型•层次数据模型来源于数据结构中的树,是一种类似于树的结构。层次模型的特征是:•(1)、它有且仅有一个根结点。•(2)、一个结点与另一个结点若有联系则尽可能为“父子关系”。•(3)、每个结点均处于某一级别之上。•(4)、每个结点均可通过“父子关系”的指针找到。1.2.2数据模型的类型•2.网状数据模型•网状数据模型是一种类似于图的结构。网状数据模型的特征是:•(1)、不存在级别•(2)、一个结点可拥有多个父结点或多个子结点•(3)、记录有若干数据项,且这些数据项可有多个值•网状数据模型在现实生活中很普遍,如一个客户与销售人员和产品的联系:一个客户可接受多个销售人员的销售,而一个销售人员可销售多个产品给客户,一个产品可被销售给多个客户,它也可被多个销售人员销售。1.2.2数据模型的类型•3.关系数据模型•网状数据库和层次数据库对数据的集中和共享问题进行了一定程度的解决,但是在数据独立性和抽象程度上仍显不足。•1970年6月是关系数据库的一个里程碑。在这个月里,IBM圣约瑟研究实验室的高级研究员埃德加·考特在CommunicationsofACM上发表了《大型共享数据库数据的关系模型》一文。ACM后来在1983年把这篇论文列为从1958年以来的25年中最具里程碑意义的25篇论文之一,因为它首次明确而清晰地为数据库系统提出了一种崭新的模型,即关系模型。1.4E-R模型•E-R模型最初是由P.P.Chen在1976年作为一个统一网络和数据库的观点而提出。E-R模型在当时被认为是一个将现实世界对应为实体和关系的概念数据模型。这个模型的最基本的模型就是直观化表示数据对象的E-R图。在P.P.Chen发表了论文后,这个模型概念被扩展开来。到了现在,E-R模型已经被作为一个数据库设计的通用设计方法被数据库设计者广泛采用。•使用E-R模型的优点在于:•1.它对关系模型进行了很好的映射:它可以很容易地转变为关系表。•2.这个模型可以很容易的实现为一个特定的数据库管理软件。•3.它浅显易懂,因此这个模型可以被数据库设计师用来相互交流1.4.1实体•E-R模型的实体指的是独立存在的对象,并且它应是数据需求所要求的,即用户所“感兴趣”的对象。它有以下两个特点:•1.实体独立的,它的存在依赖于其他实体。•2.实体之间有区别于其它实体的特征,即两个实体必然是不同的,可区分的。•实体的集合叫做实体集或实体组,它包含了若干属性相似的实体。如一本图书是一个实体,而一个图书馆的图书或一个学校的图书就组成了一个实体集。•实体有强实体类型和弱实体类型,强实体是相对弱实体而言的,它就是常规的实体。弱实体是指不满足实体特点1的实体,也就是说,它常依赖于一个强实体类型而存在。1.4.2属性•1.4.2属性•属性是实体内在特征的反映,也是外部描述实体的特征表现。例如一个餐厅作为实体来说的店名位置,服务员数等就是它的属性。•E-R数据模型中属性必须是唯一的。比如一个餐厅不允许有两个位置。属性有单值属性和多值属性。单值属性指仅有一个值的属性,多值属性指可能有两个或两个以上值的属性。如一个餐厅只有一个位置,位置就是单值属性,而这个餐厅可能有多个电话故“电话”就是多值属性。1.4.3关系•实体与实体之间的联系就是E-R模型的关系。关系从实体与关系的联系数量来说,可以分为一元关系、二元关系等,如下图:人事部企划部职员协调市场部职员老师教学生1.4.4关系的度•关系的度是与关系联系的实体数,n维关系是一个n度的一般形式。常见的是2个度和3个度的关系。•理论上来说,与某个关系有联系的实体无数量限制,但在大多数情况下,二元关系最为常见是两个实体之间的关系可以是1对1,1对多,多对多。1.4.5E-R图•E-R图是E-R模型的直观表示,在E-R图中可以看到E-R模型的各个实体的组织关系。•下面是一个设计一个火车站及其始发列车E-R图并将其转化成为关系表的例子。•首先设计火车站的E-R图:•若火车站需要设计的数据为所在城市,月台数,和客运站数,可以先设计火车站的E-R图如图1-10所示。•若火车站所发列车的属性分别为乘客数、始发时间和终点站,则可以设计其E-R图如图1-11所示。1.4.5E-R图火车站月台数客运站所在城市列车终点站乘客数始化时间1.4.5E-R图•在设计完成两个实体后,考虑其关系,并用这个关系将其关联可得如图2.0的某地区火车站的E-R图:所在城市火车站始发月台数客运站列车乘客数始发时间终点站1.4.5E-R图•可以看到,火车站到列车分别是两个实体,它们的关系是:列车从某个火车站始发,而“客运量”“所在城市”和“月台数”是火车站的三个属性。“乘客数”、“终点站”和“始发时间”是列车的三个属性。
本文标题:第01章 数据库系统简介
链接地址:https://www.777doc.com/doc-3188661 .html