您好,欢迎访问三七文档
HNND第十章多媒体数据库技术讲授朱山立主要内容第一节多媒体数据库概述第二节多媒体的相关数据模型第三节多媒体数据库管理系统第四节基于内容检索的结构和方法第五节图像和视频的检索与分析方法第六节分布式多媒体数据库系统第一节多媒体数据库概述多媒体数据库MDB(MultimediaDataBase)是对多媒体数据进行统一存储管理、操纵与控制的数据库,多媒体数据库技术是研究多媒体数据库的数据模型、MDB管理系统、MDB体系结构、MDB查询与检索、MDB系统及其应用等多学科交叉的高级数据库技术。武P167数据模型是核心及基础,数据模型的好坏直接关系到数据库系统的性能,传统数据库技术已经非常成功,但不适应多媒体数据的需求。引入数据模型是为在数据库中,抽象表示及处理现实世界中的信息。10.1.1数据库数据模型P167数据模型可分为两类1、概念模型(信息模型)按用户的观点对数据和信息建模,主要用于数据库的设计。2、数据模型按计算机系统的观点对数据建模,主要用于数据库管理系统DBMS的实现。主要的数据模型有10.1.1数据库数据模型P167网状模型、层次模型和关系模型。数据建模过程是将现实世界转化为机器世界的过程10.1.1数据库数据模型P168现实世界认识抽象信息世界概念模型机器世界数据模型转换概念模型是现实世界事物在信息世界的反映组成要素:1.实体客观存在并相互区分的事物2.属性一个实体可以由多个属性描述3.联系事物之间的联系,有三种(1︰1)(1︰n)(m︰n)4.实体型用实体名及属性名集合描述和抽象同类实体。5.实体集同类型实体的集合6.码(Key)唯一标识实体的属性集合(如ID号)7.域(Domain)属性的取值范围10.1.1数据库数据模型P168概念模型常用E-R图描述10.1.1数据库数据模型数据模型组成要素数据结构数据操作完整性约束10.1.1数据库数据模型P169数据结构是研究对象类型的集合,对象可分为两类:•一是与数据类型、内容、性质有关的对象•二是与数据之间联系的对象数据结构描述一个数据模型性质最重要的方面,一般按数据结构的类型来命名数据模型。是对数据库的静态描述数据模型组成要素数据结构数据操作完整性约束10.1.1数据库数据模型P169数据操作是指数据为中对各种对象的取值执行的操作的集合(包括操作及相关的规则)。主要操作有插入、删除、修改、检索等。数据操作是对数据库的静态描述数据模型组成要素数据结构数据操作完整性约束P169数据的约束条件是一组完整性规则的集合。完整性规则是给定的模型中数据及联系所具有的制约和依存规则,是保证数据的正确、有效和相容。10.1.1数据库数据模型字符数据文本数据声音数据图形数据图像数据视频数据武P17010.1.2多媒体数据库数据类型多媒体数据库数据类型有哪些?多媒体数据模型概述传统数据库模型只对数据本身的信息内容进行建模。多媒体数据的主要任务:能表示不同媒体数据的构造及属性特征;能指出不同媒体数据之间的关系,包括相互间的信息语义关系,媒体特性之间的关系,如时空特性关系。多媒体数据系统要对数据进行时空建模,还有表现建模。P17010.1.3多媒体数据库层次描述表现是多媒体的合成再现,加工再现,创作再现。既要表达应用的语义,也要表现时空关系。多媒体数据库的层次传统数据库系统分为三个层次。多媒体数据库的分层结构有很多研究,如对传统数据库的扩展、对面向对象数据库的扩展、超媒体层次扩展等。但思想相近。多媒体数据库的四层结构:武P17110.1.3多媒体数据库层次描述媒体支持层媒体数据模式层多媒体概念模式层多媒体用户接口层用户第二节多媒体的相关数据模型•超媒体数据模型来源于超文本数据模型。•节点有图形、图像、视频、音频、动画;•链要表现语义关系,也要表现时空关系。超媒体信息网络超媒体节点多媒体数据元10.2.1超媒体数据模型超媒体信息网络超媒体节点多媒体数据元内容表现关系数据库RDB是以关系模型为基础的,利用关系描述世界。关系就是一张二维表,行称为元组,列是属性。传统的关系数据库是第一范式的(1NF),表中不能有表。多媒体数据库要求表中有表,才够用,即NF2方法。这种数据库称为扩展关系数据库E-RDB。主要的扩展是引进抽象数据的表示方法,能够定义和表示多媒体数据,并可用扩展的SQL语言定义和操纵多媒体数据对象。武P17310.2.2NF2数据模型缺点是什么?1.面向对象的基本概念(见书)。参考面向对象的基本概念及特征语义关联的描述媒体(实体)之间的关联有:聚集关联概括关联E-R关联示例关联规则关联与方法关联武P17410.2.3面向对象的数据模型3.面向对象模型数据运算体系定义了三种数据操纵:定义操作查询操作操纵运算P17510.2.3面向对象的数据模型定义主要包括类的创建、对象的创建。类的创建主要有:类标识、一组相关属性、一组完整性约束条件、一组操作方法和超类集合。3.面向对象模型数据运算体系定义了三种数据操纵:定义操作查询操作操纵运算P17510.2.3面向对象的数据模型查询是数据库的基本操作方法。主要有:通过类名称查询类结构;通过对象名称或标识查询对象的属性值;通过类名称查询对象及对象属性;基于内容的检索。3.面向对象模型数据运算体系定义了三种数据操纵:定义操作查询操作操纵运算P17510.2.3面向对象的数据模型操纵运算主要有:插入、删除、修改4.面向对象数据模型的特点•聚集层次•方法管理•模型容易扩展•版本控制•快速查询面向对象数据模型对多媒体数据的管理有明显的优点。P17610.2.3面向对象的数据模型•继承性能够‥‥•封装性能够‥‥•对方法的管理‥‥•对象类与实例的概念有效地‥‥超文本模型是从上层“应用级”入手研究上层组织信息元模型是从中层入手,用“信息元”的概念来研究中层组织。目的是制定一个标准,使“信息元”公共化、通用化,成为上层各类应用都能调用的信息元,方便多媒体数据的交互和通信。多媒体信息元自上而下看:是信息子块。自下而上看:是超数据元。P17610.2.4信息元数据模型多媒体信息元应具有三个基本特性。1.数据的组织附加其表现属性,是基本对象的内容与表现及单媒体的表现。2.多个数据元的时空同步描述,是复合对象的同步及多媒体的同步。3.成分之间的链接描述是基本的链接功能。多媒体信息元与面向对象技术有密切关系,面向对象的封装、继承、聚合等特点,都适合复杂的多媒体数据和信息,提供了强有力的抽象机制。多媒体信息元模型利用了面向对象的方法。武P17610.2.4信息元数据模型多媒体和超媒体信息编码专家组MHEG标准超文本信息元标准,是为了在不同领域里开发多媒体和超媒体应用,定义的公共基础框架。MHEG标准分两个部分:一是概念原理性的定义,主要包括多媒体和超媒体MH对象编码原理和系统要求。二是表示超媒体信息对象及MHEG链。超媒体MH对象分为6类:1.输出内容对象2.一般输入对象3.投射器对象武P17710.2.4信息元数据模型4.基本对象5.合成对象6.条件和动作第三节多媒体数据库管理系统多媒体数据库MDMS的功能除了数据库管理系统的主要任务(存储和处理信息)外,还有以下特性:①满足多媒体数据的独立性:保持各种媒体的独立性与透明性②信息重组织:应支持符合媒体在各通道分离后存入数据库。例如,将Vedio分解为影像、配音等信息,把这些信息分别存储到数据库中,必要时各种分离的信息可能会重新组织后输出。③长事务:在MDBMS中,长事务的运行意味着在一个可靠的方式下花费大量的时间传输大容量的数据。检索一场电影就是长事务的典型例子。武P182④数据实时传输:连续数据的读和写操作必须实时完成,连续数据的传输应优先于其他数据库的管理行为。⑤干预系统资源的调度:常见的数据库管理系统不干预操作系统的工作,但在多媒体数据库管理系统中,信息处理有大数据量、长事务等方面的特性,所以要参与操作系统相关资源的调度。⑥BLOB类型的结构化问题:BLOB是数据库系统的多媒体信息存储类型。但BLOB本身不支持结构化,应对BLOB进行结构化处理。⑦描述性的搜索方法:多媒体数据的查询应基于一个描述性的、面向对象的查询格式。这种搜索方法与所有媒体都相关,包括视频和音频。10.3.1多媒体数据库的功能P182多媒体数据带来的管理问题:数据量巨大且媒体之间的差异也极大。媒体的种类增多,要求能扩充新的媒体类型。数据库的多解查询。用户接口的支持,要有浏览,查询,表现的新方法。多媒体信息的分布带来了巨大的影响。服务质量要根据系统的运行情况进行控制。版本控制问题。10.3.2多媒体数据库的管理问题武P1831、松散型(协作型)结构针对各种媒体单独建立数据库,每一种媒体的数据库都有自己独立的数据库管理系统。虽然他们是相互独立的,但是可以通过相互通信进行协调和执行相应的操作。特点:对多媒体数据库的管理是分开进行的,可以利用现在地研究成果直接进行“组装”,每一种媒体数据库的设计也不用考虑与其他媒体的区别和协调。缺点:对不同类型媒体的联合操作实际上是交给用户去完成了。使得对多种媒体的联合操作、合成处理、概念查询等较难完成。10.3.3多媒体数据库的体系结构武P18610.3.3多媒体数据库的体系结构P1862、集中型结构只存在一个单一的多媒体数据库和单一的多媒体数据库管理系统。各种媒体被统一建模,对这种媒体的管理与操纵被集中到一个数据库管理系统中,各种用户的需求被统一到一个多媒体用户接口上。优点:建模统一、管理/操作统一、用户接口统一、查询和检索结果统一表示。理论上,能够充分地做到对多媒体数据进行有效的管理和使用。但实际上这种多媒体数据库系统是很难实现的。10.3.3多媒体数据库的体系结构P1863、客户/服务器型结构减少集中统一型多媒体数据库系统复杂性的一个很有效的办法是采用主从结构。不同数据类型的媒体数据仍然相互独立,系统将每一种媒体的管理与操纵各用一个服务器来实现。所有服务器的综合和操纵也用一个服务器来完成。与用户的接口采用客户进程来实现。优点:可以针对不同的需求采用不同的服务器、客户进程组合,所以很容易符合应用的需求,对每一种媒体也可以采用与这种媒体相符合的处理办法。缺点:但采用这种体系结构必须对服务器和客户进行仔细的规划和统一考虑,采用标准化和开放的接口界面。10.3.3多媒体数据库的体系结构P18710.3.3多媒体数据库的体系结构P1864、超媒体型结构这种多媒体数据库体系结构,强调对数据时空索引的组织。在这种结构的理论下,世界上所有计算机中的信息和其他系统中的信息都应该连接在一起,而且信息也要能够随意扩展和访问。数据库分散到网络上,形成信息空间,只要设计好访问工具就能访问和使用这个信息空间。10.3.3多媒体数据库的体系结构P188第四节基于内容检索的结构和方法基于内容的检索CBR,是根据媒体和媒体对象的内容语义及上下文语义环境进行检索,如图像中颜色、纹理、形状,视频中的镜头、场景、运动等。利用内容特征建立索引并进行检索。多媒体数据库基于内容的检索特点:基于内容的检索是一种近似的匹配:一般来说,在检索的过程中,采用逐步求精的办法,每一层的中间结果是一个集合,不断减少集合的范围,知道定位目标,这一点与数据库检索的精确匹配算法有明显的不同。从媒体内容中提取信息线索:力图突破传统的基于关键字检索的局限,直接对图像、视频、音频进行分析、抽取特征,使得检索更加接近媒体对象。满足用户多层次的检索要求:CBR检索系统通常由媒体库、特征库和知识库组成。大型数据库的快速检索。10.4.1基于内容的检索武P188基于内容的检索中常用的几种媒体特征如下:(1)音频:常利用的音频特征包括基音、共振峰等音频底层特征,以及声纹、关键词等高层次的特征。(2)静态图像:其底层特征包括颜色直方图
本文标题:-多媒体数据库技术
链接地址:https://www.777doc.com/doc-4415659 .html