您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 本体不一致的诊断方法
本体不一致的诊断方法(上海海事大学信息工程学院,上海200135)摘要:近年来,语义Web技术不断发展,本体作为一种清晰表达语义和知识共享的方式,成为了语义Web的核心,其相关研究也得到了很大的进步。然而,在实际应用中,很难构建没有错误的本体,引起本体不一致的原因有很多。本文研究的是不一致本体的诊断方法,提出了模型诊断方法和局部诊断方法两部分,并给出了相应的方法描述。关键字:本体;本体不一致;诊断Abstract:Inrecentyears,theSemanticWebtechnologydevelopment,thebodyasaclearexpressionofsemanticsandknowledge-sharingmanner,becamethecoreoftheSemanticWeb,theresearchhasalsobeenalotofprogress.However,inpractice,itisdifficulttobuildthereisnowrongbody,causingthebodyinconsistentformanyreasons.Thisstudyisinconsistentwiththebodyofdiagnosticmethods,diagnosticmethodsandmodelsproposedlocaldiagnosticmethodsintwoparts,andthecorrespondingmethoddescriptionsKeywords:Ontology;Inconsistency;Diagnosis1.引言不一致本体的诊断修复方法作为解决不一致本体问题的主要方法,受到了研究者的广泛关注。因为目前的推理机只能检查出不一致本体中不可满足的概念,而无法检查出产生不一致的原因,更无法分析或修复本体中的错误。因此,研究不一致本体的诊断修复方法是非常重要和必要的,诊断修复法就是研究当本体出现不一致时,如何利用有效的方法来帮助用户分析不一致产生的原因,诊断出导致不一致出现的公理集合,进一步给出有效的解决方案修复不一致。2.模型诊断方法2.1基于模型诊断的本体不一致问题描述Reiter给出了诊断(diagnosis)问题的基本定义:当观察到一个异常行为时,从本体中找出可能引起该行为的部位。“诊断”这个概念来自医疗领域,指医生根据病人的主诉信息,诊断出发病原因的过程,例如,病人的“异常行为”表现为头部发烧,经医生诊断后确定“发病部位”是扁桃体炎症。Reiter采用一阶命题逻辑来描述问题域。Hamscher等人在Reiter的基础上,提出了模型诊断(Model-basedDiagnosis)方法,即已知一个本体,给定若干新成分(components),将这些新成分添加到该本体中,一旦新成分的添加动作引起该本体发生不一致现象,则使用诊断方法,陈复本体的一致性。它采用与Reiter相同的形式语言来描述待诊断问题的领域模型。基于模型诊断的本体不一致问题描述如下:(a)对于待诊断的本体:用一个命题公式集合来表示;(b)对于本体的每个成分X:用命题变量。okX表示该成分是否处于正常工作状态。如果没有证据证明本体不正常工作,那么假设所有变量。okX全为真。2.2系统描述定义1.1(基于诊断的本体)本体表示为一个序偶(SD,ASS),其中:(a)SD:本体描述(SystemDescription),是一个有限命题公式集合;(b)ASS:疑似元素(assumables)集合,是一个由命题变量。akX组成的有限命题变量集。用观察OBS(observation)表示待添加的新成分,它是一条命题公式。这样,就可以用(SD,ASS,OBS)表示诊断问题,称OBS是本体(SD,ASS)的一个观察。当观察到异常行为,即(SD,ASS)∪{OBS}出现不一致时,就需要诊断了。定义1.2(诊断)定义在(SD,ASS,OBS)上的诊断是一个最小集△∈ASS,使得SD∪{OBS}∪(ASS\△)∪{¬okX|okX∈△}是一致的。在模型诊断中,诊断是为了恢复本体的一致性而必须删去的疑似元素集合ASS的最小子集。一个本体的“诊断”并非总是存在的。推论1.1(SD,ASS,OBS)的诊断存在当且仅当SD∪{OBS}是一致的。根据推论1.1和定义1.2可得如下推论1.2:推论1.2△∈ASS是“(SD,ASS,OBS)的诊断”,当且仅当SD∪{OBS}∪(ASS\△)是一致的。2.3诊断计算在Reiter提出的寻找“诊断”的方法中,用到了冲突集(ConflictSet)和目标集(HittingSet)这两个概念。定义1.3(冲突集)(SD,ASS,OBS)的冲突集是一个集合Conf={okX1,okX2,...,okXn}∈ASS,使得SD∪{OBS}∪Conf不一致。根据推论1.2和定义1.3可得:△∈ASS是“(SD,ASS,OBS)的诊断”,当且仅当△是最小集,并且(ASS\△)不是“(SD,ASS,OBS)的冲突集”。给定一个由一组集合作为元素构成的集合,C的目标集与每个集合元素的交集不为空,可得定义1.4。定义1.4(目标集)设C是一个由一组集合作为元素构成的集合,C的目标集是一个集合H∈∪S,S∈C,使得对于全部S∈C,H∧S非空。C的目标集最小,当且仅当其任何真子集都不是C的目标集。下面的定理1.1给出了一种寻找“诊断”的方法。定理1.1△∈ASS是“(SD,ASS,OBS)的诊断”,当且仅当△是由“(SD,ASS,OBS)的所有最小冲突集”构成的集合的最小目标集。根据定理1.1可知找目标集首先应该找冲突集。3.局部诊断方法3.1核心收缩定义1.5(核心操作⊥)对于给定公式集B和公式a,X∈B⊥a,当且仅当:(a)X∈B;(b)a∈Cn(X);(c)对于所有Y,若Y∈X,则a∉Cn(Y)。B⊥a的元素称为a-核心,其中,Cn(X)表示所有能够由X蕴含的公式。X是蕴含a的、B的极小子集,但不唯一。定义1.6(B的切割函数σ对于任意一条公式a:(a)σ(B⊥a)∈∪(B⊥a);(b)如果∅≠X∈B⊥a,那么X∧σ(B⊥a)≠∅。由这个定义可推出结论,即去掉σ之后得到的B'不再蕴含a。3.2核心半修复诊断定义1.7(B的核心半修复?σ)对于所有公式a,B?σa=(B∪{a})\σ((B∪{a})⊥)。给定本体(SD,ASS,OBS)}SD∪ASS表示待半修复的本体,OBS表示待添加的本体,那么诊断问题与核心半修复操作具有如下对应关系:(a)冲突集:指SD∪ASS∪{OBS}的不一致核心操作中的疑似元素,表示为{X∧ASS|X∈((SD∪ASS)+OBS)⊥}。(b)切割函数:切割函数几乎与目标集对应,最小目标集是只返回疑似元素的最小切割函数值。半修复操作的两个步骤是:第1步,将待添加的本体连同疑似元素一起添入原本体中,得到一个新的本体;第2步,当新本体满足一致性时,则无须删除任何本体成分,否则找出不一致核,并且使用切割函数挑选出需要放弃的本体成分。所谓最小诊断,就是最小切割,即切割函数的一种特殊变种。定义1.8(最小切割函数)给定集合A,A-最小切割函数σA是从“公式集的集合”到“公式的集合”的函数,即对于公式集中的任何集合S,满足:(a)σA(S)∈∪S;(b)如果∅≠X∈S,那么X∧σA(S)≠∅;(c)如果对于所有X∈S},X∧A≠∅,那么σA(S)∈A,并且σA(S)是满足(a),(b),(c)的最小集。在诊断问题((SD,ASS,OBS)中,因为SD中公式的状态与ASS中公式的状态有所不同,ASS表示一种疑似状态,与SD相比,ASS具有更大的修正价值,所以不希望放弃SD或OBS中的任何句子,而宁愿放弃ASS中的谓词变量okX。因此设A是疑似元素集,则切割函数优先选择okX,即对于(SD,ASS,OBS),一旦诊断存在,那么ASS-最小切割函数只选择ASS中的元素,据此可得推论1.3。推论1.3在(SD,ASS,OBS)中,σASS是一个ASS-最小切割函数。如果诊断存在,那么σASS((SD∪ASS∪OBS)⊥⊥ASS。引理1.1出现于((SD∪ASS∪OBS)的不一致核中的疑似元素构成(SD,ASS,OBS)的冲突集”,并且所有最小冲突集都可以用下列方式得到:(a)对于所有XE(SD∪ASS∪OBS)⊥⊥,X∧ASS都是冲突集,并且,(b)对于每个最小冲突集Y,都存在着X∈(SD∪ASS∪OBS)⊥⊥,使得X∧ASS=Y。注意并非每个不一致核都能确定一个最小冲突集。给定切割函数。,集合B关于公式。的半修复是:B?σa.=(B+a)\σ((B+a,⊥),而“诊断”是ASS的元素,它将根据观察通过核心半修复操作删除。推论1.4假设S=(SD,ASS,OBS)是一个本体,σASS是一个ASS-最小切割函数,那么,(SD∪ASS)\((SD∪ASS)?σASSOBS)=σASS((SD∪ASS∪OBS)}1)是诊断。3.3局部诊断算法根据公式间的关系,用DAG图来表示SD,并给出了一个基于DAG的“诊断”寻找算法:首先从SD∪ASS∪{OBS}中找出与OBS关联的成分(用Comp表示),然后只对这一部分调用诊断算法。分割算法Compartment包括两个步骤:先调用邻接点计算算法Retrieve从ASS中找出关联疑似元素(用Relevant表示),然后根据这部分疑似元素从SD∪ASS∪{OBS}中找出与OBS关联的成分Comp。Compartment算法描述如下:输入:SD,ASS,OBS输出:关联成分CompCompartment(){Retrieve()Comp=OBSForallp∈Relevant,Comp:=Comp∪{a∈SD∪ASS|p∈Var(a)}}Retrieve算法使用Adjacent函数计算邻接于某给定结点的所有结点来收集关联于某给定结点的所有结点,即给定关联关系R,adjacent(x)={y∈Var(SD)∪ASS|R(x,y)},其中Var(X)是出现于集合X的所有公式的命题变量的集合。对于命题变量集合Y,adjacent(Y)=∪{adjacent(y)|y∈Y}。4.总结本体作为共享概念模型的明确的规范说明,其数据的组织方式还蕴含着数据间的逻辑关系,具有丰富的语义关系。将本体引入海量、异构、分布的Web信息资源整合中,为计算机系统具备语义理解的能力提供了基础条件。但由于这些Web知识具有分布性和异构性,经常会出现这些对知识的理解不一致、语义不明确等问题,即本体是不一致的,从而导致知识无法共享,无法提供有效的知识协同服务。因此,如何处理本体不一致问题成为基于本体的知识管理与服务工作中的关键问题。当本体知识库出现不一致时,它可以平凡地演绎出任何结论,针对这样的本体知识库的推理查询是没有实际意义的,因此研究如何处理本体的不一致问题是非常必要的。本文提出了基于模型诊断和局部诊断的证据验证诊断方法。我们利用模型诊断方法中的(SD,ASS,OBS)表示诊断问题,称OBS是本体((SD,ASS)的一个观察。模型诊断方法提出了基于模型诊断的本体不一致问题描述,并通过诊断进行描述和计算。局部诊断方法提出了核心收缩、核心半修复诊断,最后通过局部诊断算法来对本体不一致问题进行了分析。参考文献:[1]崔运鹏.基于本体论的农业知识管理关键技术研究[博士论文],中国农业科学院,2007.[2]马跃.语义万维网中的不协调知识处理[博士论文].北京大学,2008.[3]PaulBuitelaar,PhilippCimiano_andBernardoMagnini_DFKI,LanguageTechnologyLab_AIFB,UniversityofKarlsruhe_ITC-irst,CentroperlaRicercaScientificaeTecnologicaOntologyLearningfromText:AnOverview.[4]EugenijusKurilovas,AnitaJuskev
本文标题:本体不一致的诊断方法
链接地址:https://www.777doc.com/doc-2323559 .html