您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 其它办公文档 > 39基于本体的异构数据系统研究与实现
华南师范大学硕士学位论文基于本体的异构数据系统研究与实现第1页,共85页摘要异构数据的集成一直都是网络数据通信、信息共享的热点研究问题。数据的异构可分为四个层次:结构异构、语法异构、系统异构和语义异构。如何有效屏蔽或消除数据源不同层次上的异构性,是数据集成的重中之重。传统的异构数据集成方法如联邦数据库、数据仓库等。它们主要是从结构上消除数据的异构性,因此适应数据源相对稳定、数据模式比较单一的应用。但是,不同的数据库设计者、管理者在创建数据模式时,对概念的理解和表述往往存在差异,因此造成了语义异构、同时检索精确度下降的问题。而上述的传统方法都没有办法“理解”数据视图中各个概念的含义,更不要谈提高查询精确度的问题了。本体是共享概念模型的明确的形式化规范说明,它使计算机可以“理解”信息的含义,从而增强了系统的自动化、智能性和灵活度。目前本体的应用多集中于WEB方向,致在对信息内容提供显式的概念定义。如果将本体理论引入异构数据系统,那么它在异构数据系统的作用如何?系统的框架与具体模块是怎样的?基于本体的异构数据系统与传统系统在实验测试中的优劣如何?因此本文提出,将本体论引入异构数据系统,以克服传统的弊端。建立基于领域知识的概念模型,为集成系统提供统一的全局视图,通过数据匹配机制达到实例化,也保持了各局部数据库的自治性。另外,引入本体描述机制对专业知识体系进行明确的定义,为查询条件增加了语义内容,实现具有智能性的词义匹配查询,提高查全率与查准率。在此基础上,本文提出并初步实现了基于本体的异构数据集成与查询系统框架,并对各个模块的设计进行了详细阐述。通过实验测试,对得到的结果进行了分析,描述了本方案与传华南师范大学硕士学位论文基于本体的异构数据系统研究与实现第2页,共85页统方法相比具有的优势,在系统功能和效率上提出了自己的评价。昀后对所作的工作进行了总结,指出了系统的不足和局限,并指出了今后研究的前景与解决方法。关键字:本体、OWL、异构数据集成、本体知识库、基于本体的查询华南师范大学硕士学位论文基于本体的异构数据系统研究与实现第3页,共85页AbstractHeterogeneousdataintegrationhasbeenalwaysahotspotinresearchinnetworkdatacommunicationandinformationshare.Theheterogeneityofdatacanbesplitintofourlayers:structrueheterogeneity,grammerheterogeneity,systemheterogeneityandsemanticheterogeneity.Howtoeliminateheterogenityintheselayersisall-importantwhenintegratedatafromdifferentdatasource.Thereareseveraltraditionalwaysindataintegration,suchasFederativeDatabase,DataWarehouseandsoon.Thesewaysfocusonhowtoeliminatethestructureheterogeneity.Sotheyareeffectivefortheapplicationwhichhaverelativestabledatasourceandhomogeneousdatapattern.ButthedefineanddescriptionofconceptionsmaydifferwhenconstructaDB,sosematicheterogeneityisexist,andtheaccuracyofquerywilldescreaseatthesametime.Unlucky,Thewaysmentionedbeforecandolittlethingontheseproblem.Soanewwaywillintroducedinthispaper,thatisheterogeneousdataintegrationandquerybasedonOntology.Anontologyisaexplicitformalspecificationofaconceptualization.Ithelpscomputerto“learn”information.Indatabsae,ontologycanbeconsideredasformalspecificationofconceptionandrelationoflocalfield.Ontologyhasmanyadvantagesinsolvingtheproblemofdataintegration.Sointhesepaper,weuseontologytosupportdataintegration.Alsowedefineaknowledgebaseofcertainfieldtohelptoincreasetheaccuracyofdataquery.华南师范大学硕士学位论文基于本体的异构数据系统研究与实现第4页,共85页Basedonthemetionedworkabove,wesuggestasystemframeworkofheterogeneousdataintegrationandquerybasedonOntologyandimplementthesystem.Thenwediscourseeverymoduleinthesystemindetail.Inthesixthchapter,weanalysetheresultofexperiment,andgiveawholeevaluationofthesystem.Finallywemakeaconclusionofthework,pointouttheshortageofthesystem,andexpectthefutureresearchprospect.Keywords:Ontoloty,Owl,Heterogeneousdataintegration,Ontologyknowledgebase,QuerybasedonOntology华南师范大学硕士学位论文基于本体的异构数据系统研究与实现第5页,共85页目录摘要-----------------------------------------------------------------1Abstract-------------------------------------------------------------3第一章绪论:本文所要做的工作----------------------81.1本文的应用背景------------------------------------------81.2本文所做的工作及期望达到的目标---------------------9第二章本体概念及其应用背景----------------------------112.1本体的概念---------------------------------------------112.1.1本体的几种含义---------------------------------112.1.2本体的性质和构成------------------------------122.1.3本体的表示方式--------------------------------132.2典型的本体----------------------------------------------142.2.1词典----------------------------------------------142.2.2主题映射----------------------------------------152.2.3WordNet------------------------------------------152.3本体的应用-----------------------------------------------162.3.1搜索引擎----------------------------------------162.3.2知识工程----------------------------------------172.3.3异构信息系统---------------------------------172.4本体与语义WEB---------------------------------------182.4.1本体与语义信息模型--------------------------182.4.2语义WEB、本体和元数据--------------------182.4.3语义WEB的体系结构-------------------------192.4.4语义WEB的应用------------------------------202.5小结----------------------------------------------------21第三章本体语言与本体工具集------------------------------223.1RDF和RDFS---------------------------------------------233.1.1资源描述框架(RDF)--------------------------23华南师范大学硕士学位论文基于本体的异构数据系统研究与实现第6页,共85页3.1.2资源描述框架模式(RDFS)-------------------263.2DAML+OIL----------------------------------------------273.2.1简介-----------------------------------------------273.2.2DAML+OIL特点----------------------------------283.3WEB本体语言(OWL)-------------------------------283.3.1概述------------------------------------------------283.3.2OWL语言集与语法-------------------------------293.3.3OWLLite的语言特性----------------------------313.4本体工具集---------------------------------------------353.4.1本体工具简介------------------------------------353.4.2Protégé2000-------------------------------------37第四章基于本体的异构数据系统--------------------394.1数据集成简介-------------------------------------------394.1.1数据集成的必要性------------------------------394.1.2数据集成的发展过程---------------------------404.2异构数据集成-------------------------------------------404.2.1异构数据集成简介------------------------------414.2.2异构数据集成的步骤---------------------------434.2.3异构数据集成的层次----------------------------434.2.4异构数据集
本文标题:39基于本体的异构数据系统研究与实现
链接地址:https://www.777doc.com/doc-4330678 .html