您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 36Ontology理论研究和应用建模
Ontology理论研究和应用建模——《Ontology研究综述》、w3cOntology研究组文档以及Jena编程应用总结1关于Ontology1.1Ontology的定义Ontology最早是一个哲学的范畴,后来随着人工智能的发展,被人工智能界给予了新的定义。然后最初人们对Ontology的理解并不完善,这些定义也出在不断的发展变化中,比较有代表性的定义列表如下:范畴提出时间/提出人定义哲学客观存在的一个系统的解释和说明,客观现实的一个抽象本质计算机1991/Neches等给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义1993/Gruber概念模型的明确的规范说明1997/Borst共享概念模型的形式化规范说明1998/Studer共享概念模型的明确的形式化规范说明关于最后一个定义的说明体现了Ontology的四层含义:概念模型(cerptualization)通过抽象出客观世界中一些现象(Phenomenon)的相关概念而得到的模型,其表示的含义独立于具体的环境状态明确(explicit)所使用的概念及使用这些概念的约束都有明确的定义形式化(formal)Ontology是计算机可读的。共享(share)Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体。Ontology的目标是捕获相关的领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇之间相互关系的明确定义。1.2Ontology的建模元语Perez等人用分类法组织了Ontology,归纳出5个基本的建模元语(ModelingPrimitives):类(classes)或概念(concepts)指任何事务,如工作描述、功能、行为、策略和推理过程。从语义上讲,它表示的是对象的集合,其定义一般采用框架(frame)结构,包括概念的名称,与其他概念之间的关系的集合,以及用自然语言对概念的描述。关系(relations)在领域中概念之间的交互作用,形式上定义为n维笛卡儿积的子集:R:C1×C2×…×Cn。如子类关系(subclass-of)。在语义上关系对应于对象元组的集合。函数(functions)一类特殊的关系。该关系的前n-1个元素可以唯一决定第n个元素。形式化的定义为F:C1×C2×…×Cn-1→Cn。如Mother-of就是一个函数,mother-of(x,y)表示y是x的母亲。公理(axioms)代表永真断言,如概念乙属于概念甲的范围。实例(instances)代表元素。从语义上讲实例表示的就是对象。另外,从语义上讲,基本的关系共有4种:关系名关系描述part-of表达概念之间部分与整体的关系。kind-of表达概念之间的继承关系,类似于面向对象中的父类与子类之间的关系。instance-of表达概念的实例与概念之间的关系,类似于面向对象中的对象和类之间的关系。attribute-of表达某个概念是另一个概念的属性。如“价格”是桌子的一个属性。在实际建模过程中,概念之间的关系不限于上面列出的4种基本关系,可以根据领域的具体情况定义相应的关系。1.3Ontology和语义网络Ontology和语义网络的联系和区别列表如下:联系它们都是知识表示的形式,均可以通过带标记的有向图来表示,适合于逻辑推理。区别比较方面Ontology语义网络描述的对象和范围是对共享概念模型的规范说明,即其概念在某个特定领域是公认的,是面向特定领域的概念模型。从数学上讲是一种带有标记的有向图,最初用于表示命题信息,现广泛用于专家系统表示知识。其节点表示物理实体、概念或状态,边用于表示关系,但是对节点和边都没有特殊规定,所以描述的范围比Ontology广。【例子】:语义网络中可以表达“我的汽车是红色的”,而Ontology则适合表达如“团体组织的内部构成”等整体内容。表示的深度上有5个要素“元语,类,关系,函数,公理和实例”,它通过这5个要素来严格、正确地刻画所描述的对象。深度上不如Ontology,对建模没有特殊要求。建模条件建立必须有专家的参与,相对更加严格和困难,这也是Ontology目前的主要缺点之一。不必有专家的参与。1.4Ontology的描述语言目前在具体应用中Ontology的表示方式主要有4类:非形式化语言半非形式化语言半形式化语言形式化语言可以用自然语言来描述Ontology,也可以用框架、语义网络或逻辑语言来描述。目前普遍使用的方法列表如下:名称描述特点Ontolingua一种基于KIF(knowledgeinterchangeformat)的提供统一的规范格式来构建Ontology的语言。为构造和维护Ontology提供了统一的、计算机可读的方式;由其构造的Ontology可以方便地转换到各种知识表示和推理系统(Prolog、CORBA的IDL、CLIPS、LOOM、Epikit、Algernon和KIF),从而将Ontology的维护与使用它的目标系统隔开;主要用于Ontology服务器。CycLCyc系统的描述语言,一种体系庞大而非常灵活的知识描述语言。在一阶谓词演算的基础上扩充了等价推理、缺省推理等功能;具备一些二阶谓词演算的能力;其语言环境中配有功能很强的可进行推理的推理机。LoomOntosaurus的描述语言,一种基于一阶谓词逻辑的高级编程语言,属于描述逻辑体系。后来发展为PowrLoom语言(采用前后链规则(backwardandforwardchainer)作为推理机制)。提供表达能力强、声明性的规范说明语言;提供强大的演绎推理能力;提供多种编程风格和知识库服务。1.5已有的Ontology及其分类目前广泛使用的Ontology列表如下:名称描述Wordnet基于心理语言规则的英文词典,以synsets(在特定的上下文环境中可互换的同义词的集合)为单位组织信息。Framenet英文词典,采用称为FrameSemantics的描述框架,提供很强的语义分析能力,目前发展为FramenetII。GUM面向自然语言处理,支持多语种处理,包括基本概念及独立于各种具体语言的概念组织方式。SENSUS面向自然语言处理,为机器翻译提供概念结构,包括7万多概念。Mikrokmos面向自然语言处理,支持多语种处理,采用一种语言中间的中间语言TMR表示知识。Guarino提出以详细程度和领域依赖度两个维度对Ontology进行划分。具体说明如下:维度说明分类级别详细程度描述或刻画建模对象的程度高的称作参考(Reference)Ontologies低的称作共享(share)Ontologies领域依赖程度-顶级(top-level)Ontologies描述的是最普遍的概念及概念之间的关系,如空间、时间、事件、行为等,与具体的应用无关,其他Ontologies均为其特例。领域(domain)Ontologies描述的是特定领域中的概念和概念之间的关系。任务(task)Ontologies描述的是特定任务或行为中的概念及概念之间的关系。应用(application)Ontologies描述的是依赖于特定领域和任务的概念和概念之间的关系。1999年Perez和Benjamins归纳出了10种Ontologies:知识表示Ontologies普通Ontologies顶级Ontologies元(核心)Ontologies领域Ontologies语言Ontologies任务Ontologies领域-任务Ontologies方法Ontologies应用Ontologies但它们之间有交叉,层次不够清晰。1.6构造Ontology的规则出于对各自问题域和具体工程的考虑,构造Ontology的过程各不相同。目前没有一个标准的Ontology的构造方法。最有影响的是Gruber在1995年提出的5条规则:明确性和客观性:Ontology应该用自然语言对所定义的术语给出明确、客观的语义定义。完全性:所给出的定义是完整的,完全能表达所描述的术语的含义。一致性:由术语得出的推论与术语本身的含义是相容的,不会产生矛盾。最大单调可扩展性:向Ontology中添加通用或专用的术语时,不需要修改已有的内容。最小承诺:对待建模对象给出尽可能少的约束。目前大家公认在构造特定领域的Ontology的过程中需要领域专家的参与。2Ontology的研究和应用Ontology的研究和应用主要包括以下3方面:理论上的研究,主要研究概念及其分类,Ontology上的代数;信息系统中的应用,主要包括处理信息组织、信息检索和异构信息系统互操作问题;Ontology作为一种能在知识层提供知识共享和重用的工具在语义Web中的应用。2.1Ontology的理论研究Ontology的理论研究包括概念和概念分类、Ontology上的代数。最有代表性的是Guarino等人对概念的分类所做的深入和细致的研究,他们从一般的意义上分析了什么是概念、概念的特性、概念之间的关系以及概念的分类,提出了一套用于指导概念分类的可行理论。基于这个理论,他又提出了Ontology驱动的建模方法,在理论上为建模提供了一个通用的模式。Guarino认为概念之间的差别不仅体现在概念的定义上,同时也体现在概念的某些特性上。从这些特性出发,归纳出概念的元特性(最基本的特性),从而用公式给出元特性的严格的形式定义。在此基础上,他们又讨论了元特性之间的关系和约束,最终把研究结果作为概念分类的基本理论工具并提出一套完成的概念分类体系结构。Guarino的理论可以归纳如下:概念分类理论的基础是概念的元特性。以概念的元特性为出发点,按照一定的规则,把具有相同元特性组合的概念归为一类,进而给出一般意义上的概念分类体系。概念的基本元特性包括:持久特性、非持久特性、反持久特性、半持久特性、载体标识特性、支持标识特性、外部依赖特性等。以下是对各种特性的说明:名称描述举例持久特性严格定义为:)()(xxx。代表某个概念,)(x代表x是的一个实例,表示其后的断言永远为真。Person具有持久性,而Student不具有持久性。非持久特性对某个概念而言,存在某些实例不会永远属于该概念。Student具有非持久性。反持久特性对概念的任何一个实例,这个实例不会永远属于该概念。Youth具有反持久性。半持久特性非持久性和反持久性的差集。——载体标识特性——如Student具有载体标识特性,因为学生之间的区别不是靠学生,而是作为人来区分的。支持标识特性每个实例相互之间是可以区分的。Person具有支持标识特性,人和人之间可由标识(人的指纹)来区分。外部依赖特性一个概念对另外一个概念的某种依赖关系。概念A对概念B的外在依赖关系表现为概念A中的任何一个实例a必蕴涵属于概念B的实例b,而b不是a的一部分。Parent外在依赖于Child,某人的父母蕴涵他(她)有小孩,而他的小孩当然不是他身体的一部分。2.2Ontology在信息系统中的应用目前信息检索技术的分类和对他们的描述列举如下:分类特点缺点全文检索(Textretrieval)把用户的查询请求和全文中的每一个词进行比较,不考虑查询请求和文件语义上的匹配。虽然可以保证查全率,但是查准率大大降低。数据检索(Dataretrieval)查询要求和信息系统中的数据都遵循一定的格式,具有一定的结构,允许对特定字段检索。需要有标识字段的方法。性能取决于所使用的字段标识方法和用户对方法的理解,具有很大的局限性,支持语义匹配的能力较差。知识检索(Knowledgeretrieval)基于知识的、语义上的匹配,在查准率和查全率上有更好的保证。是信息检索的重点,特别是面向Web信息的知识检索的重点。——Ontology具有良好的概念层次结构和对逻辑推理的支持,在知识检索中有广泛应用。基于Ontol
本文标题:36Ontology理论研究和应用建模
链接地址:https://www.777doc.com/doc-5450587 .html