您好,欢迎访问三七文档
第2章数据管理基本原理与技术数据管理基本原理与技术数据库系统概述数据库系统体系结构关系数据库管理系统关系数据模型数据库分析与设计多用户DBMS体系结构分布式数据库面向对象数据库联邦式数据库数据仓库与数据集市联机分析处理与数据挖掘时态数据库空间数据库数据库管理指的是对数据的收集、组织、编目、定位、存储、检索、抽取、表示、加工、传播、维护等一系列行为操作,先后经历了人工管理阶段、文件系统阶段,并最终进入了数据库系统阶段。数据库是逻辑相关数据的一个持久性共享集合,含有数据自身的定义与描述用于实现各种数据管理。数据是描述客观事物的符号记录,是表示客观事物的语义解释。数据库管理系统是位于操作系统之上的一层数据管理软件,可以对数据库建立、运用和维护进行集中管理、集中控制。数据库系统是人机系统和数据库的有机结合,一般由数据库、数据库管理系统及其开发工具、应用系统、数据管理员和用户组成。与数据库系统有关的人可以分为数据和数据库管理员、数据库设计人员、应用开发人员和最终用户。2.1数据库系统概述ANSI/SPAPC三层体系结构从上至下分别为外模式、概念模式和内模式。外模式又称为用户视图、子模式或用户模式,描述一个与客户相关的数据库。概念模式又称为公共用户视图或逻辑模式,描述数据库中存储的数据及其关联。内模式又称为存储视图或存储模式,是数据库在计算机环境中的物理表示,描述数据库如何存储数据。2.2数据库系统体系结构通常认为完整的DBMS具备10项功能:数据存储、提取和更新用户可访问的目录事物支持并发控制恢复服务授权服务支持数据通信完整性服务提高数据独立性服务实用程序服务2.3关系数据库管理系统2.3.1关系数据库管理系统功能通常数据库管理系统包含以下组件:查询处理器数据库管理器文件管理器DML预处理器DDL编译器数据字典管理器,又称为目录管理器2.3关系数据库管理系统2.3.2关系数据库管理系统的组件以应用程序从数据库中读取一个数据为例,数据库管理系统的典型工作流程如下:1、DBMS接受用户或应用程序发出的从数据库中读取数据记录的命令;2、DBMS检查命令语法,解析语义,调用应用程序相对视图(外模式),检查存取及控制权限,决定是否执行处理操作,如果拒绝执行处理操作,直接返回错误信息;3、DBMS调用公共用户视图(概念模式),根据外模式/概念模式映射,确定读取概念模式的相关记录;4、DBMS调用存储视图(内模式),根据概念模式/内模式映射,确定读取的文件,存取方式和具体记录;5、DBMS向操作系统发出执行读取有关物理记录的命令;6、OS执行读取操作;7、OS将数据从数据库的存储区送至系统缓冲区;8、DBMS根据外模式/概念模式计算应用程序需要的记录格式;9、DBMS将数据从系统缓冲区送至应用程序的用户工作区;10、DBMS向用户返回命令执行情况的状态信息。2.3关系数据库管理系统2.3.3关系数据库管理系统的典型工作流程关系式由行(Row)和列(Column)组成的二维表(Table),也称为文件,关系中包含属性(字段)、元组(记录)、基数、维(度)、域。关系的数学基础是集合理论和谓词逻辑,具有以下特征:每个关系具有一个唯一的名称,对应于特定的关系模型;关系中每个属性具有唯一的名称;每个元组的每个属性包含一个单一值;没有重复的元组;元组从上至下排列没有顺序;属性从左至右排列没有顺序。2.4关系数据模型2.4.1关系数据结构关系代数首先支持四种基本的二目运算,分别是:并(Union)差(Difference)交(Intersection)广义笛卡尔儿积(ExtendedCartesianProduct)还有一些专门的关系运算,分别是:选择(Selection)投影(Projection)连接(Join)除(Division)2.4关系数据模型2.4.2关系代数与关系演算关系模型中主要包括三类完整性约束:实体完整性、参照完整性和用户定义的完整性。2.4关系数据模型2.4.3关系的完整性典型的信息系统具有一个完整的生命周期,通常包括:1、数据库规划数据库规划站在全局高度进行筹划,确保数据库应用系统生命周期各个阶段可以高效和有效地实施。2、系统定义阶段系统定义阶段确定数据库应用系统的范围、边界和主要用户视图。3、需求分析阶段需求分析阶段的主要任务是收集和分析数据库应用系统需求特征,形成需求说明书。4、数据库设计阶段数据库设计阶段是创建支持应用系统数据库的过程,由三个子阶段组成,即概念设计、逻辑设计和物理设计阶段。2.5数据库分析与设计①、概念设计主要是将用户需求抽象为概念模型,描述其中的尸体、关联及属性。包括自顶向下、自底向上、逐步扩张和混合策略四种方法。②、逻辑数据库设计是将概念设计获得的概念结构(例如ER图)精简映射为相应地数据模型。③、物理数据库设计确定数据库的实际实现,物理数据库设计与特定的DBMS相关。5、应用程序设计在数据库设计的同时,还可以并行地进行应用程序的设计,对于数据库应用程序而言,主要任务是事物设计和图形用户界面设计。6、建立快速原型系统(可选)通过建立快速原型系统,可以有效表达、演示系统功能和需求,为整个数据库应用系统的最终实现提供考察依据或进化的框架。2.5数据库分析与设计7、实现阶段实现阶段是确保数据库应用系统功能、安全性、完整性约束得以充分控制和实施的一个重要阶段,与采用的开发工具、组件、代码编写方式密切相关。8、数据转换和加载数据转化和加载主要完成数据的移植。9、测试阶段测试是衡量软件可靠性和软件质量的重要途径。4、运行维护阶段运行维护阶段标志着数据库应用系统的全面运行,是数据库应用系统成功研制的重要标志和里程碑。2.5数据库分析与设计实现多用户DBMS的常见体系结构包括远程处理、文件—服务器和客户—服务器。1、远程处理远程处理是多用户数据库管理系统的传统结构,又称为主从式结构。2、文件—服务器系统3、客户—服务器结构包含三种原子拓扑结构:单用户—单服务器结构、多用户—单服务器结构和多用户—多服务器结构。2.6多用户DBMS体系结构1990年C.J.Date撰文阐述了分布式数据库系统的十二个基本原则,也称为分布式数据库的十二个目标,分别是:本地自治不依赖于中心场地可连续操作性位置独立性分片独立性复制独立性分布式查询处理分布式事务管理硬件独立性操作系统独立性网络独立性DBMS独立性2.7分布式数据库2.7.1分布式数据库的基本原则DDBMS处理具备RDBMS通常的功能外,还具有一些扩展的功能:扩展的通信服务扩展的系统目录分布式查询处理扩展的安全控制机制扩展的并发控制机制扩展的恢复机制2.7分布式数据库2.7.2DDBMS功能和体系结构一个DDBMS通常包括四个组件:本地DBMS组件、数据通信组件、全局系统目录和分布式DBMS组件。2.7分布式数据库2.7.3DDBMS组件•分布式数据库设计的任务与一般数据库设计的任务基本一致,还需要着重考虑数据分段设计、数据分配设计和数据复制设计。•数据分配有四种策略:集中、分段、完成复制和有选择复制。2.7分布式数据库2.7.4分布式数据库设计Atkinson等学者将OODBMS总结为十三条强制特征,分别是:支持复杂对象支持对象标识支持封装支持类型或类支持继承支持支持动态绑定支持扩展性支持计算完整性2.8面向对象数据库2.8.1OODBMS支持持续性支持二级存储管理支持并发性支持恢复性支持即时查询设施2.8面向对象数据库2.8.1OODBMSORDBMS(ObjectRelationalDatabaseManagementSystem)具有四种基本特性:基本类型扩展复杂对象继承规则系统2.8面向对象数据库2.8.2ORDBMS联邦式数据库(FederateDatabase)是一系列自治DBMS的协同系统,其中,为自治DBMS提供可控、协同操作的软件构成联邦式数据库管理系统,简写为FDBMS。联邦式数据库的自治性意味着分离和互相独立的控制,包括:设计自治性通信自治性执行自治性关联自治性运行自治性服务自治性2.9联邦式数据库2.9.1联邦式数据库的自治性多DBS可以划分为联邦式数据库和非联邦式数据库。根据联邦的管理模式和集成方式,联邦式数据库可以划分为松耦合类型和紧耦合类型。2.9联邦式数据库2.9.2联邦式数据库分类联邦式数据库采用五层体系结构定义和实现,主要包括本地模式、成员模式、导出模式、联邦模式和外模式。2.9联邦式数据库2.9.3联邦式数据库的体系结构数据仓库是支持管理决策过程的、面向主题的、集成的、非易失的、时变的数据集合。1、面向主题面向主题意味着数据仓库是围绕组织的主题而不是围绕应用领域进行组织。2、集成集成意味着数据仓库的数据来源于组织范围内的各种不同应用系统,可以存在不一致,但经过规范调整后可以提供统一视图。3、时变时变意味着数据仓库中的数据仅仅在某个时刻或者某段时间间隔内是精确和有效地。4、非易失非易失意味着数据并不进行实时更新,而是定时从操作型系统中刷新,新的数据一般是数据仓库的补充而非取代,数据仓库不断吸收新数据,并对原有数据实现增量式集成。2.10数据仓库与数据集市数据仓库的体系结构包含四个层次:数据源、数据存储与管理、OLAP机制与服务、前端工具和应用。1、数据源数据仓库的数据源包括各种文件文档资料、操作型数据、现有业务系统的输出、专业数据源等。2、数据的存储与管理数据的存储与管理是数据仓库系统的核心功能。根据数据仓库的组织规模,可以划分为企业级数据仓库和部门级数据仓库,后者称为数据集市。3、OLAP机制与服务OLAP表示联机分析处理,是OnlineAnalyticalProcessing的缩写,OLAP工具主要分为三类:关系OLAP(ROLAP)、多维OLAP(MOLAP)、混合OLAP(HOLAP)。4、前端工具和应用前端工具和应用主要包括各种数据查询工具、自由报表工具、数据分析工具、数据挖掘工具、决策支持工具以及各种基于数据仓库或数据集市的应用开发工具。2.10数据仓库与数据集市联机分析处理(OLAP)的基本分析操作有切片、切块、下钻、上翻、旋转。根据处理数据的范围、用户分析人员的交互需要、多维分析需要以及现有工具的支持等因素将数据分析处理模型分为四种:绝对模型、解释模型、思考模型和公式模型。数据挖掘(DataMining,缩写为DM),也称为数据库中知识发现,就是从大量的、不完全的、有噪声的、模糊的、随机的数据库中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘的任务主要是聚类分析、关联分析、分类、预测、时序模式和偏差分析等。2.11联机分析处理与数据挖掘完成一项数据挖掘任务共分为7步进行:1、确定数据挖掘的目的;2、定义数据模型和数据需求;3、数据准备与整理;4、数据模型评估;5、数据挖掘方法选择及实施;6、解释结果并验证新信息;7、结果运行。2.11联机分析处理与数据挖掘时态数据库是一种能够记录对象变化历史,即能够维护数据的变化经历的数据库。时态逻辑通常有两种时间结构模型:线性模型和分支模型。2.12时态数据库时态数据库的发展分为三个主要阶段:1982年以前为开创期;1983—1993年为理论与模型探索期;1994年以后为应用发展期。2.12时态数据库典型的空间数据库的数据类型有点、线、区域,对象之间的关系包括相交、临近等,主要运算包括长度、面积和体积等。空间数据库有两个非常重要的视图:空间对象视图和空间视图。2.13空间数据库空间数据是指空间对象视图和空间视图相关联的数据,具有如下特征:空间特征;非结构化特征;空间关系特征;分类编码特征;海量数据特征2.13空间数据库空间数据的查询就是将空间代数的操作与DBMS的查询机制关联在一起,空间数据查询机制的特点如下:基本空间代数操作;可
本文标题:数据库安全
链接地址:https://www.777doc.com/doc-1263024 .html