您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 文本挖掘技术13-Ontology
1本体(Ontology)杨建武Email:yangjianwu@icst.pku.edu.cn第十三章:北京大学计算机科学技术研究所文本挖掘技术(2009)2信息交流美洲虎3对内容的理解“tank“事物(Things)词语、符号(Symbols)Standsfor指向(Referto)联想(Evoke)概念(Concept)?“罐““坦克“4关于Ontology的译名和定义¾哲学领域ontology是运用以存在(Being)为核心的各种范畴通过逻辑的方法去构造哲学原理的学问。它是在概念王国里的纯粹的思辨哲学。本体论存在论是论¾人工智能领域1991/Neches等:给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义;1993/Gruber:概念模型的明确的规范说明;1997/Borst:共享概念模型的形式化规范说明;1998/Studer:共享概念模型的明确的形式化规范说明5Studer(98)Formal,explicitspecificationofasharedconceptualizationMachineConsensualReadableknowledgeConcepts,properties,Abstractmodeloffunctions,axiomsaresomephenomenaexplicitlydefinedintheworld本体的定义机器可读的领域内的共识明确的定义通过抽象出客观世界中一些现象(Phenomenon)的相关概念而得到的模型,其表示的含义独立于具体的环境状态共享概念模型的明确的形式化规范说明提供一套概念和术语来描述某一领域,并且获取该领域的本质的概念结构。6为什么需要Ontology?¾知识分享的问题:不同的系统使用不同的概念和术语。很难从一个系统中提取知识运用到另一个系统中。¾由于对跨系统的知识重用和分享的兴趣的增大,导致对Ontology的兴趣大增。¾开发可重用的Ontology以推进共享和重用是Ontology研究的一个重要目标。¾开发支持构建、合并和翻译Ontology的工具是研究的另一个目标。7构建Ontology的目标¾构建Ontology的目标捕获相关的领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,从不同层次的形式化模式上给出这些词汇(术语)和词汇之间相互关系的明确定义。8明确的Ontology能够支持¾在人们之间共享理解¾工具间的互操作性¾系统工程¾可重用性¾定义主题词表和概念¾定义必要的充足的概念和“方法”¾共同的知识理论¾扮演数学在物理中所扮演的角色(内容理论)9Ontology:对现实世界的描述¾世界存在对象(Object)¾对象可以抽象出类(Class)¾对象具有属性(Property/Attribute),属性可以赋值(Value)¾对象之间存在着不同的关系(Relation)¾对象可以分解成部分(Part)¾对象具有不同的状态(State)¾属性和关系随着时间推移而改变¾不同时刻会有不同的事件(Event)发生¾事件能导致其他事件发生或状态改变¾在一定的时间段上存在着过程(Process),对象则参与到过程之中10¾本体=概念+属性+公理+取值+名义¾本体=概念类+关系+函数+公理+实例本体的构成11Ontology与知识库的关系¾Ontology为知识库的建立提供一个基本的结构;¾Ontology提供一套概念和术语来描述某一领域,并且获取该领域本质的概念结构;¾知识库运用这些术语去表达现实或者虚拟世界中的正确知识。12本体的分类¾顶级本体描述最普遍的概念及概念之间的关系,如空间、时间、事件、行为等等,与具体的应用无关,其他种类的本体都是该类本体的特例。¾领域本体特定领域(如:医药)中的概念及概念之间的关系。¾任务本体特定任务或行为中的概念及概念之间的关系。¾应用本体依赖于特定领域和任务的概念及概念之间的关系。13SemanticWeb与OWL14什么是语义网¾不同于:SemanticNetwork(语义网络)¾Web现状:网上的信息表达一般是以•自然语言(中文、英语、匈牙利语…)•图表、多媒体、版面格式人类可以使用,但机器难以使用¾TheSemanticWeb(语义网)TimBerners-Lee,会议(2000.12)语义网是当前万维网的扩展与延伸语义网的信息是机器可理解的,具有充分完备的语义定义,能促进人与计算机建立语义上的合作机器可读Æ机器可理解15语义网体系结构Meta16语义网体系结构¾1.Unicode和URI:是整个语义网的基础,Unicode处理资源的编码;URI负责标识资源。¾2.XML+NameSpace+XMLSchema:表示数据的内容和结构。¾3.RDF+RDFSchema,描述资源及其类型。¾4.本体层(OWL):描述资源之间的联系。¾5.逻辑层:公理和推理规则¾6.证明层:执行规则、评判信赖¾7.信任层:信任机制17本体描述语言的演变¾OWL:OntologyWebLanguage2004年2月由W3C正式推出AlanguagefordefiningandinstantiatingWebontologiesRDFOILDAMLDAML+OILOWL18知识表达知识价值术语表和数据字典辞典与分类法元数据与数据模型形式化本体与推理语义形式的陈述性知识19RDF概念RDF三元组BookTitle主体谓词客体是VC技术内幕¾RDF:通过属性与值来描述资源以及资源之间的关系,三元组:“主体-谓词-客体”20¾举例:rdf:Descriptionabout='技术内幕/BookTitleHome-Pagerdf:resource='‘//rdf:DescriptionRDF概念被描述资源的URI被描述资源中有一个属性叫BookTitle(即书名),其取值是VC技术内幕被描述资源中有一属性叫Home-Page(即主页),其值指向另一资源结束标志21从RDF/RDFS到OWL¾RDFS:提出了类的概念,定义了类和性质并可以用来描述其他的类和性质¾RDFS描述资源的能力还不够强大¾RDFS难以提供推理方面的支持22OWL的三个子集¾OWLfullOWL语法与RDF的合集,完备的本体语言¾OWLDL倾向于逻辑描述,表达能力强,忽略了对RDFS的兼容性¾OWLLite降低了OWLDL中的公理约束保证一个高效的推理过程¾(S),OIL-core,OWL-Lite,OWLRDF(S),OIL-core,OWL-Lite,OWLOWL-LiteOILCoreRDFSchemaOWL-DLOWLFull≈DAML+OIL≈InstanceOIL24OWLLite语言构造子¾RDFSchema特征:Class;rdfs:subClassOf;rdf:Property;rdfs:subPropertyOf;rdfs:domain;rdfs:range;Indivual;¾等同性:equivalentClass;equivalentProperty;sameAs;differentFrom;AllDifferent;distinctMembers;¾属性特征:ObjectProperty;DatatypeProperty;inverseOf;TransitiveProperty;SymmetricProperty;FunctionalProperty;InverseFunctionalProperty¾属性限制Restriction;onProperty;allValuesFrom;someValuesFrom25OWLLite语言构造子¾基数限制:minCardinality;maxCardinality;cardinality(0/1)¾类相交:intersectionOf¾头信息:Ontology;imports¾版本信息:vertionInfo;priorVersion;backwardCompatibleWith;incompatibleWith;DeprecatedClass;DeprecatedProperty¾评注性质:rdfs:label;rdfs:comment;rdfs:seeAlso;rdfs:isDefinedBy;AnnotationProperty;OntologyProperty26OWLDL/FULL扩展的构造子¾类公理:oneOf;dataRange;disjointWith;equivalentClass;rdfs:subClassOf¾类表达式的布尔组合:unionOf;complementOf;intersectionOf¾任意基数:minCardinality;maxCardinality;cardinality¾填充信息:hasValue27RDFS相关特征¾Class,类,拥有共同性质的个体集合OWL:Thing;OWL:Noting¾rdfs:subClassOf,子类,类间层次关系¾Individual,个体,类的实例¾rdf:Property,属性,owl:ObjectProperty:个体间二元关系owl:DatatypeProperty:个体到数值的二元关系¾rdfs:subPropertyOf,子属性,属性间层次关系¾Rdfs:domain;rdfs:range,定义域、值域28等价与不等价¾equivalentClass,两个类等价¾equivalentProperty,两个属性等价¾sameAs,两个个体相同¾differentFrom,两个个体不同¾AllDifferent,多个个体互不相同29属性特征(性质类型)¾TransitiveProperty,性质具传递性P(x,y)&P(y,z)ÆP(x,z)¾SymmetricProperty,性质具对称性P(x,y)ÆP(y,x)¾FunctionalProperty,性质具函数性P(x,y)&P(x,z)Æy=z¾inverseOf,两性质互逆P1(x,y)ÆP2(y,x)¾InverseFunctionalProperty,性质具反函数性P(y,x)&P(z,x)Æy=z30属性限制与基数限制¾allValueFrom,属性取值来源于指定的类¾someValueFrom,至少一个来源于指定类¾Candinality,基数,取值个数¾maxCandinality,最多取值个数¾minCandinality,最少取值个数31OWLDL/OWLFULL增值特征¾oneOf,枚举,枚举个体对类进行描述¾hasValue,相关个体中至少一个的值等于指定的值¾disjointWith,类与类之间互斥,没有公共元素¾unionOf,complementOf,intersectionOf,布尔组合,形成新的类或属性¾Candinality,maxCandinality,minCandinality,OWLLite中,基数被限定为只能是0或1;OWLDL和OWLFULL中基数允许为任意非负数32OWL语义小结¾概念及其关系的分类化、层次化结构subClassOf、subPropertyOf¾概念间的同义、反义等语义关系sameClassAs、samePropertyAs、inverseOf、equivalenTo¾概念间的逻辑组合关系intersectionOf、unionOf、complementOf、oneOf¾对关系约束进行描述domain、range、toClass、hasValue、candinality、minCandinality、maxC
本文标题:文本挖掘技术13-Ontology
链接地址:https://www.777doc.com/doc-6493068 .html