您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 招聘面试 > 基于相似度计算的本体映射研究与实现
中南大学硕士学位论文基于相似度计算的本体映射研究与实现姓名:肖文芳申请学位级别:硕士专业:计算机软件与理论指导教师:徐德智20070426基于相似度计算的本体映射研究与实现作者:肖文芳学位授予单位:中南大学相似文献(10条)1.学位论文甘丹语义Web中本体映射的研究2008语义Web是Web发展的一个新兴方向,自TimBerners-Lee提出语义Web的概念之后,就一直成为人们讨论与研究的热点。随着语义Web的发展,基于本体的应用也越来越广泛,对本体的研究日益成为计算机领域中一个热门的方向。本体被定义为共享概念模型的形式规范说明。本体具有强大的知识共享和重用的能力。应用本体的主要目的是为了知识共享和复用。然而,在分布式应用环境(如语义web)中,一个孤立的本体是不能满足要求的,往往需要继承多个本体以支持不同本体之间的共享和交流。科研人员从实际出发提出多种构造本体的标准,其中最有影响的是T.R.Gruber提出的5个准则:明确性和客观性、一致性、完全性、最大单调可扩展性、最小承诺。但由于目前本体的构造并没有一个统一的标准,本体的创建者和建模方法也不尽相同,这都会导致大量不同本体的出现,本体的异构问题日显突出。在语义Web中,为了获取其他应用所拥有的信息,或者联合多个应用以实现更强大的功能,不同应用系统之间的信息交互非常普遍和频繁。然而,如果不同的系统采用的本体是异构的,他们之间的信息交互便无法正常进行。实际的语义Web应用中,本体异构造成了大量的信息共享和交互问题。因此,解决本体异构,消除应用系统间的互操作障碍,是语义Web发展面临的关键问题之一。为了解决上述问题,这就需要在不同的本体元素间建立联系,本体映射的目的就是找出这些本体之间的语义联系。通过一定的方法在已有的不同本体之间建立映射,以便在已存在的和新的领域之间进行交流时有通用的接口和共同的理解。目前,关于本体映射方面的研究有很多。已提出的本体映射方法按本体定义模型进行分类,主要有:(1)基于语法的方法;(2)基于概念实例的方法;(3)基于概念定义的方法;(4)基于概念结构的方法,这些方法都参照了本体定义的不同部分。按映射采用的技术分类可以分为:(1)基于规则的方法;(2)统计学的方法;3)机器学习的方法。需要说明的是,每个映射方法往往是多种技术和多种参照对象的结合。然而,这些方法大都存在相似度计算不完善,相似度计算量过高,映射计算过于片面等问题。本文中使用一种多策略综合的本体映射方法,初步实现用OWLDL作为描述语言的异构本体之间的映射。首先对语义Web和本体映射的相关概念和方法进行了介绍,分析了当前语义Web技术的一些新发展以及有关本体映射的国内外研究现状。针对现有方法的不足,对原有方法进行改进,提出了一种新的多策略综合映射机制,并通过理论分析和实验结果验证算法的可行性和有效性。本体映射关系的发现、表达和执行是目前语义Web发展应用中面临的重要问题,而映射本身是一件复杂而又艰难的过程,所以本文中主要侧重语义相似度的计算和映射关系的发现。最后结合基于语义Web的广西旅游信息服务平台来详细说明多策略综合映射机制的具体应用。本文的主要工作总结如下:第一,介绍本体映射的研究背景和目前的研究现状、语义web的相关技术和体系结构,语义本体的概念以及分类。第二,介绍本体映射的有关概念和方法,对现有的本体映射方法进行介绍分析,选择合适的算法作为本课题研究的主要方法。第三,在现有映射方法的基础上设计出新的映射方法—多策略综合的本体映射方法,以完善目前本体映射方法存在的缺陷和不足。对多策略综合方法中的实例、结构、类公理等三个相似度分量计算的映射方法进行了详细的介绍说明和实验验证。验证本文提出方法的可行性和有效性。第四,应用改进的本体映射方法实现异构本体的映射。给出本体映射的体系框架,分析其模型功能系统,实验结合广西区旅游信息服务平台的构建,结果表明,改进的方法不仅能够很好的解决由于本体异构而产生不相容问题,能较好的满足数据共享的需求,提高共享能力,同时又能克服目前匹配方法单一,不全面的问题,从而能有效的提高本体匹配的精确度,提高其信息搜索的准确率。第五,对所做的工作进行总结,展望了未来所要做的工作,并陈述了本体和本体映射的研究方向及发展前景。基于语义Web的本体映射研究还处于起步阶段,还有很多地方需要更进一步的改进,本文下一步的工作将主要研究更加合理、效率更高的本体映射算法,以提高系统的效率。2.期刊论文李佳燕.史一民.李冠宇.陈布伟.LIJia-yan.SHIYi-min.LIGuan-yu.CHENBu-wei基于本体映射的语义Web服务发现框架-计算机工程与设计2009,30(24)分析了语义Web服务中存在的本体异构问题,讨论了语义Web服务发现中输入、输出匹配的方法,以及本体映射中概念相似度计算方法.在已有的Web服务模型基础上,引入语义Web服务发现的机制,提出了一个基于本体映射的语义Web服务发现框架,并阐述了其实现机制.该框架下的本体映射技术的应用能够增强语义Web服务发现的能力.3.学位论文李日晖语义Web搜索中的本体映射研究2005针对现有的互联网络对语义内容描述的缺失,语义Web使用RDF规范化描述资源,本体描述资源的语义信息。语义Web的搜索就是要根据关键字的语义同语义Web上的资源进行语义比较,返回语义相同或相似的结果给用户。本体是语义Web上信息共享的基础,然而本体的多样性带来了语义信息的多样性,本体映射是解决语义共享的有效途径。根据本体的特点和映射的用途不同,可以将本体映射分为域内本体映射和域间本体映射,并分别采用多本体结构和混合本体结构的映射框架。这两种本体映射的信息分别为域内本体映射信息和域间本体映射信息。域内映射信息记录了领域内的语义信息共享的情况,域间映射信息则记录了领域间的映射信息的情况。在语义Web搜索模型中,语义映射信息的描述形式和查询算法、本体映射关系的准确性都对语义Web搜索的性能有很大的影响。语义映射信息在语义Web搜索过程中经常被查询,因此它的组织方式、描述形式、查询方法对语义Web搜索有很大的影响。多值信息系统的组织方式和RDF的描述形式使语义映射信息简单方便地提取,并且能在语义Web上最大化共享。使用比较集合相似度的多值信息系统查询算法能准确地查找出相关语义映射信息。领域本体具有结点众多,领域交叉范围小的特点。域间本体映射的剪枝算法从领域本体较抽象的基本体开始舍弃那些不可能存在映射的分支,再在剩余的分支中具体地考察映射。剪枝算法在很大程度上降低了映射的规模,同时减小了相似度的计算量,提高了领域领域本体映射的效率。4.期刊论文袁洋.李善平基于语义Web的本体映射方法综述-计算机科学2004,31(5)本体之间的映射是语义Web发展中的一个重要问题.事实上,语义Web是由多种信息源组成的,每个信息源都以某个本体的形式表示.为了实现这些信息源的信息共享,就要用到本体映射方法.本文首先讨论了本体映射的三种体系结构.然后按照E.Rahm提出的分类标准,对现有的一些主要的本体映射方法进行归纳.最后,给出了4种方法的比较分析.从中可以看出各种独立匹配方法的组合将是一个极有希望的发展方向.5.学位论文靳涛面向语义Web的多策略本体映射研究2008随着语义Web的发展,基于本体的开发和应用越来越多。本体是共享概念模型的形式化规范说明。由于本体开发本身具有分布式的特点,不同组织开发的本体可能覆盖相同或者相交的领域,因此在应用中为了更有效地共享和重用本体,就必须找出不同本体之间的映射关系。本体映射就是发现两个异构本体之间的语义关系,并将这种语义关系形式化表达出来的过程,它对于实现语义Web中不同本体之间的互操作具有重要意义。本文围绕本体映射问题,在分析了本体映射的研究现状的基础上,针对本体间元素名称、实例、结构等特征,提出了一种多策略的本体映射方法,实现了异构本体间的自动映射。主要包括以下几方面内容:(1)研究本体及本体映射理论,分析了本体异构性产生的原因,给出了本体元素间相似度的形式化定义。(2)采用了一种基于语言学的策略,利用编辑距离和WordNet词典计算本体元素名称间的相似度,并对利用WordNet计算相似度的方法进行了改进。(3)针对本体中实例,提出了一种基于实例的策略,通过语义富含,增加实例,并利用向量空间模型对本体间基于实例的相似度进行计算。(4)提出了一种基于结构的策略,针对本体的结构特点,利用树核函数和相似度传递模型计算本体基于结构的相似度。(5)通过相似度合并算法得到本体元素对的综合相似度,利用映射发现算法输出本体之间的映射关系。本文最后设计和实现了一个多策略的本体映射原型系统MSOM,对文中提出的算法进行了实验和分析,实验结果表明该算法可以得到较好的查准率。6.学位论文陈刘荣语义Web中基于多策略的本体映射研究2009语义Web是Web发展的延伸,其目标是使Web上的信息具有计算机可理解的语义。本体则描述了其中的语义,本体是实现语义Web的关键要素。在计算机科学领域,本体被定义为共享概念模型的形式化规范说明,它反映了领域专家对该领域知识的看法。由于语义Web分布式的特点,数据来自于多个不同的本体,这些海量异构本体为信息共享带来了不便。为了实现异构本体间的互操作,本体映射是最有效的解决方法。br 本文在对语义Web相关技术进行研究的基础上,分析了造成本体异质的原因及其对应的解决方法,定义本体相似度,对比分析已有本体映射系统,针对已有系统的计算量大和计算不够全面的问题和不足,提出多策略综合相似度映射模型MSCMOM。br 计算语义相似度是本体映射的关键技术,相似度计算的准确性决定了本体映射成功与否。本文在分析本体映射研究现状的基础上,针对本体概念名称、概念定义、概念实例、概念结构和概念属性特征,提出一种基于多策略综合相似度本体映射模型,实现异构本体间的映射。最后通过输入两个本体实例来对整个相似度计算过程进行模拟,验证了该模型相似度计算是准确可行的。br 本文的创新性工作有:br △采用候选映射集思想对相似度计算对进行过滤,减少本体相似度计算量;br △在属性相似度计算时,采用信息增益策略,减少属性相似度的计算量;br △提出多策略综合相似度本体映射模型。7.期刊论文语义集成中的不确定性本体映射模型-计算机工程与应用2009,45(28)语义Web的高速发展使其具有动态性和异构性特征,解决语义信息的异构性问题成为实现信息集成的关键.本体作为一种语义Web的知识表示形式,增强了Web的语义信息.因此,为了解决语义异构性,实现数据间的互操作,必须建立异构本体间的映射关系.然而,为庞大的异构本体建立完全精确的本体映射是不现实的,本体映射中存在一定的不确定性.提出了一种新型的本体映射框架--语义集成中的不确定性本体映射.从不同方面研究本体特征,集合了多种映射策略,并引入了各映射策略中不确定性匹配的解决方案.实验证明,该方法具有可靠的实验性能,并且具有很好的通用性和可扩展性.8.学位论文张天本体映射修正算法及本体映射评价标准的研究2008语义Web的目标是使得Web上的信息具有计算机可以处理的语义。语义原生XML数据库系统(简称SNAX)的目的在于构建一个提供研究语义Web的各种理论、技术和方法的平台。本体映射技术对于SNAX中的本体查询、本体集成等都是至关重要的一部分,本文将着重对此进行研究。首先,本文对语义Web的研究背景和SNAX系统的研发目的进行了简介,并描述了SNAX系统的体系结构和本体映射子系统SNAXMapping2的模块结构。其次,针对当前本体映射系统对语义信息的利用不充分,导致结果的查准率和查全率偏低,难以满足实际应用的需求的问题,提出并实现了一种基于推理的本体映射修正算法。然后实现了该算法,并将其融合进本体映射子系统SNAXMapping2中,并利用国际组织OAEI提供的标准测试数据集benchmarks对系统进行了测试,同时利用查准率和查全率作为衡量标准对映射结果进行了统计
本文标题:基于相似度计算的本体映射研究与实现
链接地址:https://www.777doc.com/doc-5453994 .html