您好,欢迎访问三七文档
第10章多媒体数据库技术数据管理技术的发展可以大体归为三个阶段:人工管理文件系统数据库管理系统。人工管理这一阶段(20世纪50年代中期以前),计算机主要用于科学计算。外部存储器只有磁带、卡片和纸带等还没有磁盘等直接存取存储设备。软件只有汇编语言,尚无数据管理方面的软件。数据处理方式基本是批处理。这个阶段有如下几个特点:1.计算机系统不提供对用户数据的管理功能。用户编制程序时,必须全面考虑好相关的数据,包括数据的定义、存储结构以及存取方法等。程序和数据是一个不可分割的整体。数据脱离了程序就无任何存在的价值,数据无独立性。2.数据不能共享。不同的程序均有各自的数据,这些数据对不同的程序通常是不相同的,不可共享;即使不同的程序使用了相同的一组数据,这些数据也不能共享,程序中仍然需要各自加人这组数据,谁也不能省略。基于这种数据的不可共享性,必然导致程序与程序之间存在大量的重复数据,浪费了存储空间。3.不单独保存数据。基于数据与程序是一个整体,数据只为本程序所使用,数据只有与相应的程序一起保存才有价值,否则就毫无用处。所以,所有程序的数据均不单独保存。文件系统在这一阶段(20世纪50年代后期至60年代中期)计算机不仅用于科学计算,还利用在信息管理方面。此时,外部存储器已有磁盘、磁鼓等直接存取的存储设备。软件领域出现了操作系统和高级软件。操作系统中的文件系统是专门管理外存的数据管理软件,文件是操作系统管理的重要资源之一。数据处理方式有批处理,也有联机实时处理。这个阶段有如下几个特点:1.数据以“文件”形式可长期保存在外部存储器的磁盘上。。2.数据的逻辑结构与物理结构有了区别,但比较简单。程序与数据之间具有“设备独立性”,即程序只需用文件名就可与数据打交道,不必关心数据的物理位置。由操作系统的文件系统提供存取方法(读/写)。3.文件组织已多样化。有索引文件、链接文件和直接存取文件等。但文件之间相互独立、缺乏联系。数据之间的联系要通过程序去构造。4.数据不再属于某个特定的程序,可以重复使用,即数据面向应用。但是文件结构的设计仍然是基于特定的用途,程序基于特定的物理结构和存取方法,因此程序与数据结构之间的依赖关系并未根本改变。5.对数据的操作以记录为单位。这是由于文件中只存储数据,不存储文件记录的结构描述信息。文件的建立、存取、查询、插人、删除、修改等所有操作,都要用程序来实现。随着数据管理规模的扩大,数据量急剧增加,文件系统显露出一些缺陷:a.数据冗余。由于文件之间缺乏联系,造成每个应用程序都有对应的文件,有可能同样的数据在多个文件中重复存储。b.不一致性。这往往是由数据冗余造成的,在进行更新操作时,稍不谨慎,就可能使同样的数据在不同的文件中不一样。数据联系弱。这是由于文件之间相互独立,缺乏联系造成的。c.文件系统阶段是数据管理技术发展中的一个重要阶段。在这一阶段中,得到充分发展的数据结构和算法丰富了计算机科学,为数据管理技术的进一步发展打下了基础,现在仍是计算机软件科学的重要基础。数据库管理系统这一阶段(60年代后期),数据管理技术进入数据库系统阶段。数据库系统克服了文件系统的缺陷,提供了对数据更高级、更有效的管理。这个阶段的程序和数据的联系通过数据库管理系统来实现(DBMS)近年来,随着多媒体数据库的引入,对数据的管理方法又开始酝酿新的变革。我们知道,传统数据库的模型主要针对整数、实数、定长字符等规范数据。数据库的设计者必须把真实的世界抽象为规范数据,这要求设计者具有一定的技巧,而且在一定情况下,这项工作会特别的困难。即使抽象完成了,抽象得到的结果往往会损失部分的原始信息,甚至会出现错误。当图像、声音、动态视频等多媒体信息引入计算机之后,可以表达的信息范围大大扩展,但又带来许多新的问题。在这种情况下,如何使用数据库系统来描述这些数据呢?另一方面,传统数据库可以在用户给出查询条件之后迅速地检索到正确的信息,但那是针对使用字符数值型数据的。现在,我们面临着这样的问题:如果基本数据不再是字符数值型,而是图像、声音,甚至是视频数据,那我们将怎样检索?如何表达多媒体信息的内容?我们应该如何组织这些数据呢?查询应该如何进行?这些都是我们不得不考虑的。多媒体数据库是数据库技术与多媒体技术结合的产物。多媒体数据库不是对现有的数据进行界面上的包装,而是从多媒体数据与信息本身的特性出发,考虑将其引入到数据库中之后而带来的有关问题。多媒体数据库从本质上来说,要解决三个难题。第一是信息媒体的多样化,不仅仅是数值数据和字符数据,要扩大到多媒体数据的存储、组织、使用和管理。第二要解决多媒体数据集成或表现集成,实现多媒体数据之间的交叉调用和融合,集成粒度越细,多媒体一体化表现才越强,应用的价值也才越大。第三是多媒体数据与人之间的交互性。没有交互性就没有多媒体,要改变传统数据库查询的被动性,能以多媒体方式主动表现。10.1.1多媒体数据库的数据数据是表征事物特性的,它们可以取自于现实世界,也可以通过模拟构造产生。因此,数据可以有原始型、描述型或指示型三种数据形式存在于计算机中。10.1多媒体数据库概述1、原始的数据原始的数据是根据实物采集而得到的,例如,声音或图像的采集。当对采样数据进行A/D转换后,可以得到一系列相关的二进制信号,这些二进制信号就代表着原始的,不带有任何特殊附加符号的文件格式。2、描述性数据描述性数据通常是带有说明特征的,可以是关键词、语句、段落,或者是语音或声音。并且数据可以采用结构化或非结构化形式。3、指示性数据指示性数据通常以多媒体元素的参数为内容,即为多媒体元素的特征赋予特定的语义。例如表示图像大小的高和宽、表示线条的粗或细、表示声音的强或弱等。2、描述性数据3、指示性数据多媒体数据库是一种数据容器,是因某种应用的需要而建立的,目的是组织有特定联系的数据,以便对这些数据进行管理、运用和共享。多媒体数据库所组织的数据可以包括数值、字符串、文本、图形、图像、声音、和视像等。1、数值在数据库中,数值可以用来表征事物的大小或高低等简单属性,例如,人事档案库中的年龄、工资、身材等。也可以表示事物的类别、层次等,如性别、部门、学历等。对数值数据可以进行算术运算,可以提供有关事物的统计特征。2、字符串字符串即由数字、字母或其它符号连接组成的符号串,其形式近乎于事物本身的特征,并常通过各个角度对事物进行描述,例如,电话号码、地址、时间等。对字符串数据可以进行连接运算,在数据库管理中是较便于检索的一种类型。3、文本大量的字符串组成文本数据。文本主要以自然语言对事物进行说明性的表示,例如,简历、备注等。其内容抽象度高,计算机理解需要基于一定的技术。在管理上也增加了难度,例如,存储问题、语义归类问题、检索问题等。4、图形图形数据以点、线、角、圆、弧为基本单位,一个完整复杂的图形也可以分解为这些基本的元素来存储。此外,还必须保存各图形元素之间的位置与层次关系。例如,图形元素库、工程图纸库等。图形数据是基于符号的,因此存储量小,便于存取和管理,但图形的使用以显示为主,必须结合图形显示技术。5、图像图像数据以空间离散的点为基础,如果对这种原始数据进行存取的话,将不利于将来对数据的检索,所以通常都通过一定的格式加以组合。数据库中常用尺寸、颜色、纹理、分割等对抽象的语义来描述图像的属性。在特定范围内,图像数据库在存取和检索方面也已经有成功的应用,例如,指纹库、人像库、形体库等。6、音频由于音频分为声音、语音和音乐。其中声音数据的范围太大太杂,不便于存储和管理。语音数据的存取也是建立在波形文件基础上的,鉴于语言、语音以及语气的诸多因素,波形的检索还存在着较大的难度,只有对各声波段附加数值、字符串或文本数据,并以它们作为检索的依据,才能达到非声波本身属性方面的的检索。在目前的实际应用中,只有对特定声音或特定语音的存取才具有实际意义。而音乐是表示乐器的模拟声音,它以符号方式记录信号,因此容易存取、检索和管理。它类似于图形,一段完整复杂的音乐可以分解音符、音色、音调等元素来存储。此外,还必须保存时间及其它相关属性。7、动画和影像动画和影像类似与图像,区别与图像的是它的表现必须时间属性的变化密切配合。动画和影像数据可以分解成文字、解说、配音、场景、剪辑以及时间关系等多种元素,在空间和时间上的管理比其它数据要复杂得多,无论是对各元素的检索还是对组合元素的检索,都存在着相当的难度。但若作为一个整体,可以如声波那样附加以特定的数数据,实现非动画和影像本身属性方面的检索。10.1.2多媒体数据库的体系结构多媒体数据库的组织结构多媒体数据库的组织结构尚未建立统一的体系结构,大致有以下几种组织结构。组合型结构集中统一型结构客户/服务型结构(网络服务器)超媒体型结构组合型结构这种结构是通过整合技术连接的。组合型结构中可以拥有多个独立的媒体数据库,如文本数据库、音频数据库和图像数据库,每一种媒体数据库的设计不需要考虑和其它数据库的匹配,并且都有自己独立的数据库管理系统,如图10-1所示。实际应用时,用户可以对其中任何一个媒体数据库单独进行访问和管理。对于多数据库的访问是分别进行的,可以通过相互通信来进行协调和执行相应的操作。这种多数据库的联合访问需要开发用户应用程序去实现。为了提高使用效率,目前多数据库的整合技术已有所发展,对于传统型数据库的整合技术已经达到的由于阶段,而对于复杂的多媒体多数据库的整合技术还需要一个研究过程。集中统一型结构该结构如图10-2所示,其中包含一个多媒体数据库和一个多媒体数据库管理系统。各种媒体被统一地建于数据库中,由一个数据库管理系统统一管理和提供访问。目的是要满足用户对多特征事物的数据存储和管理,以便达到统一综合应用的效果。但关键的技术基础是需要建立合适且便于存储、检索和管理的数据类型。目前,面向对象的数据类型就是建立复杂多媒体数据类型的一种方法。更有效的多媒体数据类型的模式有待于进一步的研究。客户/服务型结构(网络服务器)如图10-3所示,客户/服务型结构有多媒体数据库、各媒体服务器、多媒体管理服务器、用户接口程序和用户应用程序组成。其中各种媒体数据库相对独立,并通过专用服务器和一个多媒体管理服务器相连。多媒体管理服务器综合各专用服务器的操纵,通过特定的中间件系统连接用户的接口程序,最终达到与客户之间的信息交换。这种结构比较适用于网络环境中,用户可以单独选择或组合选择多媒体服务器的服务。但作为开放互联网中的一种有效的应用,必须基于一定的标准,包括多媒体数据类型的模型、数据库模型、标准用户接口等。超媒体型结构如图10-4所示,各种媒体数据库分散存储于与网络有连接的存储空间,互联网提供了一个信号传递的通道。该体系结构强调对数据时空索引的组织,通过建立适当的访问工具,就可以随意访问和使用这些数据。多媒体数据库的层次结构(1)传统数据库的层次用户用户用户物理模式概念模式外部模式数据库图6.2.1数据库管理系统的3层模式物理模式的主要职能是定义数据的存储组织方法(数据库文件的格式、索引文件组织方法、数据库在网络上的分布方法)概念模式定义抽象现实世界的方法外部模式又称子模式,是概念模式中对用户有用的一部分概念模式借助数据模型来描述,数据库系统的性能与数据库数据模型直接相关如果引入多媒体数据,这种系统划分肯定不能满足要求,就必须寻找恰当的结构分层形式。已有多种层次划分,包括对传统数据库的扩展、对面向对象数据库的扩展、超媒体层次扩展等。虽然各有所不同,但大都是从最低层增加对多媒体数据的控制与支持,在最高层支持多媒体的综合表现和用户的查询描述,在中间增加对多媒体数据的关联和超链的处理。在这里我们综合各种多媒体数据的层次结构的合理成分,我们提出一种多媒体数据库层次结构的划分:(2)多媒体数据库的层次划分媒体支持层存取与存储数据模型层概念数据模型层多媒体用户接口层媒体支持层建立在多媒体操作系统之上,针对各种媒体的特殊性质,在该层中要对媒体进行相应的分割、识别、变换等操作,并确定物理存储的位置和方法,以实现对各种媒体的最基本数据的管理和操纵。由于媒体性质差别大,对于媒体的支持
本文标题:多媒体数据库技术
链接地址:https://www.777doc.com/doc-1473969 .html