您好,欢迎访问三七文档
2020/6/191第8章多媒体数据库技术8.1多媒体数据库概述2020/6/192•传统数据库都是以数值和字符数据为管理对象,其应用对象主要是一般商业或事务数据,它通常不涉及到诸如图像、声音等多媒体数据。当数据库管理对象被扩充到用来管理多媒体数据,由于描述的数据结构即数据模型不同,其性质和功能都将出现重大变化,存储结构和存取机制出现基本差异,此时用以管理多媒体数据的数据库管理系统就是多媒体数据库管理系统(MDBMS)。经过多年的研究与开发,MDBMS在理论上取得了一定进展,也由一些多媒体数据的DBMS出现,当还不够完善与成熟。2020/6/1938.1.1多媒体数据•1.媒体•信息的交换和传播必须借助于一定的媒体,“媒体”(Media)就是信息得以表示或传播的载体,其基本功能就是向人们传递各种信息。在计算机领域内,可以将媒体划分为如下几个部分。2020/6/194•●感觉媒体•●表示媒体•●存储媒体•●传输媒体2020/6/195•2.多媒体•从词源上看,“多媒体”一词由前缀multi和字根media两部分复合而成。Multi来源于拉丁字multus,其意为“大量的”;Media是拉丁字medium的复数形式,表示“媒体”的意思。因此,从词源上推断,多媒体意为“多种媒介综合体”。例如,电影是由音频(Audio)和视频(Video)综合而成的一种信息表示和传播的形式(载体),它是一种多媒体。2020/6/196•3.多媒体数据•在以计算机和网络通信为基础的信息时代,人们所指的多媒体大多是数字化的多媒体,即基于计算机技术的多媒体,称之为计算机多媒体(ComputerMultimedia)。多媒体数据是指由多种不同类型媒体综合组成的,通常包括文本、图形、图像、声音、视频图像和动画等媒体形式。只包含某种媒体的数据称为单媒体。当然,单媒体可以看作是特殊的多媒体。2020/6/1978.1.2多媒体数据分类•多媒体数据按其特征可以分为以下6种。•1.文本数据•2.声音数据•3.图像数据•4.图形数据•5.影视数据•6.生成媒体数据2020/6/1988.1.3多媒体数据特征•与传统的数据相比,多媒体数据具有如下几种特性:•1.集成特性•2.独立特性•3.数据量大•4.实时性强•5.具有交互性•6.非解释特性•7.非结构特性2020/6/1998.1.4多媒体数据库•1.多媒体数据库•传统数据库是以数字和字符数据为管理对象,其应用对象主要是一般的商业或事务数据,一般不涉及诸如图像和声音等,但当数据库管理对象被扩充到用来管理多媒体数据之后,其性质和功能都发生了重大变化。此时存储结构和存取结构不同,描述它们的数据结构和数据模型也不同。由此产生的用于管理多媒体数据的数据库管理系统就是多媒体数据库管理系统(MDBMS),其对应的数据库系统就是多媒体数据库系统(multimediadatabase,MD)。2020/6/1910•2.多媒体数据库特征•从多媒体数据库管理系统的角度来看,多媒体数据库具有如下特征。•(1)多媒体数据库不同于经典数据库,在其处理数据对象、数据类型、数据结构、数据模型、应用对象等方面都与经典数据库有着较大差异。2020/6/1911•2)多媒体数据库存储和处理的是现实世界中的复杂对象,这些对象往往通过多种形式的媒体来综合表现自己,如动态的视频。经典数据库是对于格式化数据进行存储和处理,图像或声音媒体都作为无格式化数据而存在,而其存储特征则是一类二进制大对象,存储对象变化使得存储技术增加了新的内容,需要进行特殊处理,如进行数据压缩等。2020/6/1912•(3)多媒体数据库是面向应用的,其功能需求与应用密切相关,因此它并不是基于某一特定的数据类型,而是随着应用领域和对象而建立相应的数据模型,如可以概括地划分多媒体数据为简单型、复杂型和智能型,用来表示不同类型的应用。2020/6/1913•3)多媒体数据库从实用性要求出发,强调媒体间的独立性,其概念可以与经典数据库多要求的数据独立性进行类比,即多媒体数据库用户应当最大限度地忽略各媒体间的差别,从而实现对对媒体数据的操作与管理。2020/6/1914•(4)经典数据模型概念更强调应用对象的逻辑结构。而多媒体应用则对于对象的物理表示和交付方式非常重视,多媒体系统的意义和作用就在于能将物理存储的信息以多媒体形式向用户表现和提供,因此多媒体数据库更强调用户界面的灵活性和多样性。单媒体显示相对容易,而混合媒体如声像的表现,由于涉及到媒体的同步和集成,因此要复杂得多。2020/6/1915•(5)多媒体数据库应具有较强的对象访问手段,从而使多媒体数据库具有实用价值,访问方式可包括通过多媒体对象类型和建立的对象聚集。对象概括访问对象,通过多媒体关系,媒体特征进行访问,特征访问主要用于对图像和声音等对象的访问,这里还涉及到特征抽取等问题。浏览访问、近似性查询、混合方式访问都是多媒体数据库特有的查询方式。2020/6/19168.1.5多媒体数据库主要技术•1.大容量、高带宽的存储器系统•文本的存储和检索技术早已成熟。多媒体存储则是较新的课题。多媒体存储需要考虑若干新的需要,例如巨大的存储空间、大型对象、多个相关对象和对检索的时间要求等。多媒体存储和检索最主要的特点是要考虑多媒体对象的庞大数据量及实时性的要求。2020/6/1917•2.多媒体数据模型•数据库系统的一个核心问题就是如何表示和处理实体间的联系,而表示实体之间联系的模型就是数据模型。数据模型可以用一种较为严格的定义表述为:数据模型(datamodel)是由数学上一组定义组成,这些概念可以用来表达数据密集型应用中的静态和动态性质。由于多媒体数据的来源紧密依赖于应用,很难有统一的模型面向所有应用需求,因此,讨论多媒体数据模型实质上只能提供若干有利于多媒体应用的建模技术和方法,本章正是按照这个思路进行研究。2020/6/1918•3.元数据及其生成•多媒体数据库中存在有大量的二进制位串、字符流等非结构化和半结构化数据,要理解和查询这类数据,就必须对其进行必要的描述和解释。这种描述和解释的数据是关于数据的数据,人们通常称为多媒体元数据。多媒体元数据对于多媒体数据极端重要,它是多媒体数据的解释与描述,更是用户识别、选择多媒体数据的基本依据,因此,要进行多媒体数据的查询与管理,就要研究多媒体元数据及其生成。2020/6/1919•4.查询和索引技术•数据查询是任何一个数据库系统最基本和最重要的功能之一,在多媒体数据库中,数据查询条件一般表示为元数据应当满足的条件,而不是直接表示为媒体数据应该满足的条件,由此,带来一些新的技术和方法问题需要处理。另外还有基于多媒体本身特性的多解查询、基于媒体内容的检索技术(特征提取、索引和查询优化)等基本课题也需要进行研究。2020/6/19208.2多媒体数据模型•目前,建立多媒体数据模型的方法大多是在关系数据模型和面向对象数据模型基础上进行改进。主要方法有如下两种:•●扩展现有关系数据库管理系统(RDBMS),用于支持类似于二进制对象的各种多媒体对象。将RDBMS从基本的二进制对象扩展到继承和类这一概念。•●转变为发展成熟的面向对象数据库,以支持SQL语言。将数据库和应用软件转变为面向对象的数据并使用面向对象的语言,如C++,或使用对象的SQL来开发。2020/6/19218.2.1多媒体数据模型的层次•多媒体数据模型是用来描述任何多媒体数据静态特性和动态特性的一组概念和定义,一般可以分为如下三个层次。•●概念数据模型(conceptualdatamodel,CDM)•●逻辑数据模型(logicaldatamodel,LDM)•●物理数据模型(physicaldatamodel,PDM)2020/6/1922现实世界RW概念世界CDMCDMCDM逻辑与物理数据模型LDMLDMLDMPDMPDMPDM多媒体概念数据模型MCDM多媒体数据库MDB集成集成2020/6/1923•按照应用对象的复杂程度,可以将数据模型分为三种:简单性、复杂型和智能型数据模型。•简单型数据模型对应于多媒体简单应用,其特征是涉及到的对象多为静态,结构较为简单,查询比较确定。相对于简单数据模型的就是简单型多媒体数据库它主要完成对多媒体数据中的物理媒体数据的有效管理和存取,建立多媒体数据及其文本说明等属性之间的相互关系。2020/6/1924•复杂型多媒体数据模型表述一类结构较为复杂、可以进行某种意义上模糊查询的多媒体应用,其特征是具有复杂的结构,实体之间存在多重联系,查询方式多样。相对于复杂数据模型的就是复杂型多媒体数据库,它主要完成对多媒体中所包含的物理媒体数据、逻辑媒体数据的统一描述、有效存取和管理,能对多媒体数据中包含的多种语义信息进行描述、存取和管理。2020/6/1925•智能型数据模型是指一类具有特殊复杂对象、应用要求相当复杂的系统,其特征是对系统的描述具有很高的要求。相对于智能型数据模型的就是智能型多媒体数据库,它不但能够对多种媒体数据进行有效的存储和管理,还能够支持对多种媒体数据的理解以及从中进行知识获取。在知识引导下的查询及其相应智能化的操作和处理。2020/6/19268.2.2扩展的关系数据模型•传统的关系数据模型缺少支持多媒体数据库的能力。RDBMS只是为管理表格字母数字形式的数据设计的,很难实现具有空间关系和时态关系的数据,缺乏演绎和推理操作。•最近,关系数据库管理系统开始使用大二进制对象(BLOB)来存储和管理多媒体对象。BLOB可用于图像或其他二进制数据类型的对象。关系数据库中包括BLOB的位置信息,这些信息实际存储在数据库之外的分离的图像或视频服务器上。通过访问这些BLOB,为用户显示完整的数据集。2020/6/1927•此外,尽管目前绝大多数关系数据库都支持整型、浮点、字符串、货币、日期和布尔量等数据类型,有一些也增加了一些新特点,如在BLOB中查询超文本,但是还存在如下几点主要不足:2020/6/1928•(1)它们不支持如派生和聚合这样的类关系。•(2)未加修改的关系模型不支持自动管理数据的同步编辑,如版本管理等。•(3)关系数据库的计算模型也不支持扩展结构的遍历操作所需要的内存驻留对象的概念。例如,在演示一个包含有图像和全运动视频剪辑的RTF文本时的操作。2020/6/1929•(4)关系模型不能进行具有某种复杂度的长周期事务处理,例如需要对被多个用户访问的分布式多媒体对象进行更新操作。•所以,为了能在多媒体数据库中使用关系数据模型,必须对关系数据库进行必要的扩充和改进。2020/6/19308.2.3面向对象模型•20世纪90年代以来,面向对象模型是另一种表达多媒体数据库的主要方法,许多多媒体应用中的数据管理都建立在面向对象模型上。2020/6/1931•面向对象数据库模型类的概念对多媒体数据特别有用。一旦定义了类,所有类中的对象就被赋予了类的属性。类定义在应用软件的开发速度上也有着明显的优势,并且有利于为开发和维护复杂多媒体应用软件提供更完善的功能及更广泛的对象性能。此外,对象数据库的功能,如消息传递、可扩展性、支持分层结构,对于多媒体系统来说也都是非常重要的。2020/6/1932•但是,面向对象的数据模型目前尚无一个统一的标准,缺乏坚实的理论基础,许多实际技术还不够成熟。为了更好地满足多媒体数据库管理的需求,还需要做进一步研究和改进。例如增加反映多媒体对象之间时空关系的描述,描述多媒体对象间更深刻的语义。2020/6/19338.3多媒体元数据及其生成•8.3.1多媒体元数据•1.多媒体元数据概念•多媒体数据往往由多种媒体组合而成。多媒体数据类型不同,表示方式也各不相同。不同的表示形式,其存取方式和绘制方式等各不相同。因此,多媒体数据库还应包括处理不同对象的相关方法库。多媒体数据库与方法库应紧密相关联,以便进行数据对象的组合、分解和变换等操作。所以,多媒体数据应包括数据原始对象(也称数据源)、数据对象的说明(元数据等)以及与对象相关联的方法3部分2020/6/1934数
本文标题:多媒体数据库技术
链接地址:https://www.777doc.com/doc-6037405 .html