您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 其它办公文档 > Jena+中文教程本体API
Jena简介一般来说,我们在Protege这样的编辑器里构建了本体,就会想在应用程序里使用它,这就需要一些开发接口。用程序操作本体是很必要的,因为在很多情况下,我们要自动生成本体,靠人手通过Protege创建所有本体是不现实的。Jena是HP公司开发的这样一套API,似乎HP公司在本体这方面走得很靠前,其他大公司还在观望吗?可以这样说,Jena对应用程序就像Protege对我们,我们使用Protege操作本体,应用程序则是使用Jena来做同样的工作,当然这些应用程序还是得由我们来编写。其实Protege本身也是在Jena的基础上开发的,你看如果Protege的console里报异常的话,多半会和Jena有关。最近出了一个ProtegeOWLAPI,相当于对Jena的包装,据说使用起来更方便,这个API就是Protege的OWLPlugin所使用的,相信作者经过OWLPlugin的开发以后,说这些话是有一定依据的。题目是说用Jena处理OWL,其实Jena当然不只能处理OWL,就像Protege除了能处理OWL外还能处理RDF(S)一样。Jena最基本的使用是处理RDF(S),但毕竟OWL已经成为W3C的推荐标准,所以对它的支持也是大势所趋。好了,现在来点实际的,怎样用Jena读我们用Protege创建的OWL本体呢,假设你有一个OWL本体文件(.owl),里面定义了动物类(,注意这并不是一个实际存在的URL,不要试图去访问它),并且它有一些实例,现在看如下代码:OntModelm=ModelFactory.createOntologyModel();FilemyFile=...;m.read(newFileInputStream(myFile),);ResIteratoriter=m.listSubjectsWithProperty(RDF.type,m.getResource());while(iter.hasNext()){Resourceanimal=(Resource)iter.next();System.out.println(animal.getLocalName());}和操作RDF(S)不同,com.hp.hpl.jena.ontology.OntModel是专门处理本体(Ontology)的,它是com.hp.hpl.jena.rdf.model.Model的子接口,具有Model的全部功能,同时还有一些Model没有的功能,例如listClasses()、listObjectProperties(),因为只有在本体里才有“类”和“属性”的概念。上面的代码很简单,从ModelFactory创建一个OntModel,从指定文件把模型读到内存里。再下面的代码是一个例子,作用是取出模型中所有Animal的实例(Individual,也叫个体),并打印它们的名称。要从OntModel里取实例,也可以用listIndividuals()方法,只不过你得在得到的实例中判断它们是不是Animal的实例,我觉得不如用上面这种简易查询的方式来得方便。Jena里扩展了很多Iterator,比如ResIterator、StmtIterator和NodeIterator等等,刚开始用会觉得很别扭,好象还不如都用java标准的Iterator,不知道Jena的设计者是怎么考虑的。要熟练掌握还是得对整个Jena的API有全局掌握才好。在循环里,我们得到的每个元素都是一个Resource,因为本体里的任何东西都是资源,不论你想得到Subject、Property还是Object,在Jena里实际得到的都是资源(Resource),在Jena里,Property是Resource的子接口,而Jena并没有Subject或Object接口。(注:在OWL本体中,Subject-Property-Object组成一个三元组,例如:张小刚-父亲-张大刚;或者:绵羊多利-rdf:type-动物,rdf:type是一个特殊的属性,表示前者是后者的实例)暂时先写到这,关于在本体中引入其他本体和使用推理,下次继续。本文简单介绍Jena(Jena2.4),使用Protégé3.1(不是最新版本)创建一个简单的生物(Creature)本体,然后参照Jena文档中的一个例子对本体进行简单的处理,输出本体中的Class、Property等信息。本文内容安排如下:Ø介绍JenaØ运行JenaØJenaOntologyAPIØ例子Ø参考资料一、介绍JenaJena由HPLabs()开发的Java开发工具包,用于SemanticWeb(语义网)中的应用程序开发;Jana是开源的,在下载的文档中有Jena的完整代码。Jena框架主要包括:a)以RDF/XML、三元组形式读写RDF资源描述框架是(RDF)是描述资源的一项标准(在技术上是W3C的推荐标准),Jena文档中有一部分呢详细介绍了RDF和JenaRDFAPI,其内容包括对JenaRDF包的介绍、RDF模型的创建、读写、查询等操作,以及RDF容器等的讨论。b)RDFS,OWL,DAML+OIL等本体的操作Jena框架包含一个本体子系统(OntologySubsystem),它提供的API允许处理基于RDF的本体数据,也就是说,它支持OWL,DAML+OIL和RDFS。本体API与推理子系统结合可以从特定本体中提取信息,Jena2还提供文档管理器(OntDocumentManager)以支持对导入本体的文档管理。c)利用数据库保存数据Jena2允许将数据存储到硬盘中,或者是OWL文件,或者是关系数据库中。本文处理的本体就是OWL文件读入的。d)查询模型Jena2提供了ARQ查询引擎,它实现SPARQL查询语言和RDQL,从而支持对模型的查询。另外,查询引擎与关系数据库相关联,这使得查询存储在关系数据库中的本体时能够达到更高的效率。e)基于规则的推理Jena2支持基于规则的简单推理,其推理机制支持将推理器(inferencereasoners)导入Jena,创建模型时将推理器与模型关联以实现推理。Protégé是一个开源的本体编辑器(目前的版本是Protégé3.2),用户可以在GUI环境下创建本体或者知识库。有一种说法是:Jena对应用程序就像Protégé对我们——我们使用Protégé操作本体,应用程序则是使用Jena来做同样的工作。当然这些应用程序还是得由我们来编写。二、运行Jena可以在Jena的主页()下载Jena的最新版本,目前是Jena2.4版本。Jena是JavaAPI,所以需要Java运行环境。本文使用的是jdk1.5.0_04和Eclipse3.2。将下载的Jena-2.4.zip解压到任意路径,解压之后生成Jena2.4文件夹,将Jena2.4lib下的jar文件全部加入CLASSPATH,这样就可以在任意的Java编辑器中调用JenaAPI了。在解压目录下有一个test.bat文件,用于配置的测试。在控制台运行此程序,如果你的配置正确,测试将顺利完成。G:\jade\lib\jade.jar;G:\jade\lib\iiop.jar;G:\jade\lib\commons-codec\commons-codec-1.3.jar;G:\jade\lib\javaTools.jar;G:\jade\lib\http.jar;G:\jena\lib\antlr-2.7.5.jar;G:\jena\lib\arq.jar;G:\jena\lib\arq-extra.jar;G:\jena\lib\commons-logging-1.1.jar;G:\jena\lib\concurrent.jar;G:\jena\lib\icu4j_3_4.jar;G:\jena\lib\iri.jar;G:\jena\lib\jena.jar;G:\jena\lib\jenatest.jar;G:\jena\lib\json.jar;G:\jena\lib\junit.jar;G:\jena\lib\alog4j-1.2.12.jar;G:\jena\lib\lucene-core-2.0.0.jar;G:\jena\lib\stax-api-1.0.jar;G:\jena\lib\wstx-asl-3.0.0.jar;G:\jena\lib\xercesImpl.jar;G:\jena\lib\xml-apis.jar如果使用Eclipse,则可以通过修改工程的Java创建路径的方法导入Jenajar文件。在Eclipse下创建Java工程,右健单击工程名字,选择“属性/Properties”,在打开的对话框中选择“Java创建路径/JavaBuildPath”,在右边标签中选择“库/Libraries”,之后选择“添加外部文件/AddExtenalJARs”,找到Jena2.4lib目录下的所有jar文件并将其添加到工程。这样就可以运行Jean文档中的例子了。三、JenaOntologyAPIJena2.4的OntologyAPI包含在ontology包(com.hp.hpl.jena.ontology)中,可以在目录Jena-2.4srccomhphpljenaontology下查看所有程序的代码,Jena本体部分的说明网页是Jena-2.4docontologyindex.html,本部分内容以及程序的编写主要参考这两个文档。在语义网上有很多表示本体信息的本体语言,其中表达能力最强的是OWL,OWL按复杂程度分为OWLFull、OWLDL和OWLLite三个版本。其他的本体语言还有RDFS、DAML+OIL。JenaOntologyAPI为语义网应用程序开发者提供了一组独立于具体语言的一致编程接口。Jena提供的接口本质上都是Java程序,也就是.java文件经过javac之后生成的.class文件。显然,class文件并不能提示本体创建使用的语言。为了区别于其他的表示方法,每种本体语言都有一个自己的框架(profile),它列出了这种语言使用的类(概念)和属性的构建方式和URI。因此,在DAML框架里,对象属性()的URI是daml:ObjectProperty,而在OWL框架里却是owl:ObjectProperty。RDFS并没有定义对象属性,所以在RDFS框架里,对象属性的URI是null。在Jena中,这种框架通过参数的设置在创建时与本体模型(OntologyModel)绑定在一起。本体模型继承自Jena中的Model类。Model允许访问RDF数据集合中的陈述(Statements),OntModel对此进行了扩展,以便支持本体中的各种数据对象:类(classes)、属性(properties)、实例(个体individuals)。本部分简单介绍要用到的几个java类或者接口。1.本体模型OntModel本体模型(OntModel)是对JenaRDF模型的扩展(继承自RDF模型),提供了处理本体数据的功能。使用Jena处理本体首先就是要建立一个本体模型,之后就能够通过本体模型中所定义的方法操作模型,比如导入子模型()、获取模型中本体的信息、操作本体属性以及将本体的表示输出到磁盘文件等等。Jena通过model包中的ModelFactory创建本体模型,ModelFactory是Jena提供用来创建各种模型的类,在类中定义了具体实现模型的成员数据以及创建模型的二十多种方法。一个最简单的创建本体模型的语句如下:OntModelontModel=ModelFactory.createOntologyModel();该语句不含参数,应用默
本文标题:Jena+中文教程本体API
链接地址:https://www.777doc.com/doc-1496824 .html