您好,欢迎访问三七文档
移动生活与新媒体实验室徐源祝云凯北京邮电大学语义物联网目录语义技术物联网本体物联网资源描述语义搜索语义web技术需求与概念架构语义物联网语义技术——需求与概念语义网(SemanticWeb)的核心是:通过给万维网上的文档(如:HTML)添加能够被计算机所理解的语义(Metadata),从而使整个互联网成为一个通用的信息交换媒介。语义万维网通过使用标准、置标语言和相关的处理工具来扩展万维网的能力。现在语义web已经运用在很多领域,随着物联网资源的丰富,不同系统间及同一系统内不同层次间的数据描述格式的差异将极大的限制资源间的知识共享。Google的蜂鸟语义搜索算法和沃尔玛的语义搜索引擎“Polaris”。语义技术——架构上图标识了三个部分:语义架构、语义工程和外部组件:1.语义架构包含了能提供核心功能给语义工程和外部组件的服务和API。2.语义工程包含了建立在语义架构功能的基础上能提供给人类用户本体管理和开发功能的工具和服务。3.外部组件包含了利用语义架构提供的功能的软件代理。因为语义工程和外部组件都使用了统一一个语义架构,人们可以使用开发功能来改变已存储的信息,这样可以轻松地修改和管理外部组件的行为。语义技术——架构语义架构由两层组成:存储层和实用层。1.存储层包含能够提供存储基于元数据的语义信息的组件。因此,仓库将存储RDF三元组,而注册将存储本体,让存储在仓库中的数据能通过HTTP协议访问。两个存储组件应该满足高安全、可拓展和性能要求,以便能支持大规模的应用程序。2.实用层包含了能够提供业务逻辑(允许应用能使用RDF和本体)的语义能力。这些组件包括:查询组件,该组件允许在RDF仓库里执行SPARQL查询请求发布组件,该组件允许发布RDF数据到一个仓库中订阅组件,该控件允许订阅特定的数据推理组件,该控件允许在当前知识和本体里产生新的知识由于性能的原因,历史上一些推理功能已经由仓库来提供而不是特定的组件。语义技术——语义架构语义工程同样由两层组成:服务层和工具层。1.服务层包含能支持有关本体和数据工程(比如本体模块化、本体转化、本体查询和不一致决策等等)的服务。由于工程和方法论正在不断地开发,服务层将允许部署新的服务。这些服务接口需要以后确认。2.工具层由一组工具展现,这些工具以一种合成的方式来支持本体工程处理和本体开发方法。由于工程和方法论正在不断地开发,工具层将提供给机制去集合新的工具到现有的框架里。以下是一些初始的工具:本体浏览器,该工具可以让用户通过本体网络来浏览和呈现本体本体编辑器,该工具允许用户去编辑已存在系统中的本体仓库管理,该工具允许用户与语义框架中的仓库进行交互。语义技术——语义工程语义技术——语义物联网架构设备层包括物联网环境中所有感知、控制设备,这些设备提供了所在环境的感知数据或者可以执行操作、控制任务。数据层将设备层中的每个设备一一映射为数据层中的一个数据集,并通过RestfulAPI的方式实现数据的开放。通过设备层到数据层的映射,屏蔽了设备在硬件、通信模式上的异构。资源抽象层对数据层中的设备自描述信息进行了设备层面上的抽象,屏蔽了系统内、同层次设备在资源描述模型上的异构。概念抽象层屏蔽了物联网环境下异构系统间及同一系统内不同层次间资源描述模型的异构。物联网本体概念与体系结构构建模型构建工具物联网本体——概念与体系结构本体是一类与具体领域相结合的知识库,通过定义领域内概念及概念间关系的方式为整个领域建立网状的知识系统。本体作为语义技术的核心模块,为基于语义的搜索、推理等应用提供了基本知识。物联网本体——现有本体物联网本体——构建模式目前的物联网本体都是基于领域专家人工构建,较权威的有W3C语义传感器网络孵化器构建的SSN本体,此外还有CSIRO、MMI、CESN、A3ME、OntoSensor等十余个物联网领域本体。这些本体以粗粒度方式描述了物联网领域的基本概念,但受限于人工构建速度的局限和物联网技术的飞速发展,这些本体缺乏对特定系统特征、新兴概念的描述,不适合直接运用在我们特定的物联网系统中。因此,我们需要研究更为便捷、更为自动化的本体自动构建技术。现阶段本体自动构建模型一般包含如下几个部分:对文本信息源进行分词、去停止词等预处理;通过模式提取从文本信息源中获取知识元组(知识元组由概念与概念间的关系组成);计算知识元组全集中概念、关系的语义相似性,合并相似的概念、关系构成初始化本体;计算初始化本体中概念、关系的重要度及布尔关系,构成层次化的本体。物联网本体——普遍问题选择合适的现有领域本体作为上层本体是经典的本体构建工程五步骤之一,这一步骤可以充分利用已有的领域本体知识;同时,针对不同系统构建的不同本体都将以特定的领域本体作为统一的上层本体,不同本体中的概念可以通过统一的上层本体实现知识的跨系统互通,而现有的本体自动构建模型中都忽略了这一步骤。知识元组提取部分中,现有的本体自动构建模型普遍采用自然语言处理算法从信息源的每个句子中分别提取知识元组,忽视了单个语句与信息源的段落上下文信息的关系,这一问题将直接影响本体概念提取的准确性。语义相似性体现了一对概念在特定领域、特定环境下指代对象的相似性,包含了参照词典获得的语言相似性和所在环境带来的结构相似性。现有研究缺乏对结构相似性的深入研究,这一问题将导致本体中的概念仅仅体现了概念词汇的语言学特性而不是这一词汇在具体场景中的语义特性。物联网环境中广泛的存在着以xml为代表的结构化信息源。与非结构化信息源相比,结构化信息源提供了更为精炼的知识表达方式和精确的分层知识。物联网本体——构建模型基于结构化信息源的物联网本体自动构建物联网环境下含有大量的结构化信息源,这些结构化文档从平台、网关、设备、数据等不同侧面提供了领域概念及关系。通过利用结构化信息源中的树形结构信息,可以方便的提取三元组用于构建物联网本体。物联网本体——构建模型基于上层本体的物联网本体自动构建构建流程:从文本信息源中提取带有上下文标签的知识元组;对基本知识元组进行规范化处理;选择合适的领域本体作为上层本体;计算上层本体及知识元组全集中概念、关系的语义相似性,合并相似概念构成系统本体。物联网本体——构建工具包含十余种常用的本体构建基本组件,例如:NLP及XML提取主谓宾三元组、中文分词、同近意词等。集成了基于非结构化文档和结构化文档的两个构建模型。物联网本体——API文档物联网本体——构建示例Xively::::::资源描述需求与概念现有资源描述构建模型资源描述——需求与概念资源描述是物联网中设备、数据及服务的自描述信息,是物联网资源开放的基本载体。现有成果可以分为两类:第一类是由各个标准化机构定义的基于XML的资源模型及资源描述框架;第二类是在第一类的基础上引入本体思想,将描述框架提供的词汇、层次结构本体化。这里的资源描述不是RDF,RDF只是一个定义了三元组的XMLschema,我们这里的资源描述是在利用RDF三元组结构之上的,与具体业务场景相结合的一套定制化XMLschema。按照依赖结构可以分为:XML=RDFschema=资源描述schema=资源描述文件。资源描述——现有资源描述在第一类中,主要代表有ANSIN42.42、OGCSWE工作组创建的三个协议(SensorML、TransducerML和O&M)标准。SensorML是基于XMLschema的,主要用于描述传感器的功能模型和传感器观测值处理过程。SensorML提供了一个良好的框架来表示物理资源、虚拟资源、传感器网和一套从原始数据衍生出高级信息的机制。TransducerML基于XML的,他的目的是为传感器和处理程序之间交互、融合异构传感器数据、获取传感器数据精度和准度数据提供标准。O&M提供了一个统一的模型来表示传感器的观测数据。在第二类中,主要代表有OntoSensor、SensorWebforAutonomousMissionOperations(SWAMO)ontology、WirelessSensorNetworksOntology(WISNO)等。OntoSensor使用SUMO本体、ISO19115标准(地理信息模式)、OGCSensorML。本体使用OWL-Full构建,由Protégé工具实现并用Prolog工具测试和验证。SWAMO被设计用来实现传感器设备及服务之间动态的可互操作性。WISNO将传感器划分为传感器和控制器两类。资源描述——现有资源描述不同IOT平台的资源描述结构。资源描述——需求定制化:不同IOT平台面向的资源层次不同(平台、网关、设备、数据、逻辑等),同层次资源的描述需求也不相同,因此资源描述schema需要具备定制化能力。互通性:定制化带来的是不同资源描述schema之间的封闭性,因此需要建立物联网上层知识库(本体),以实现不同资源描述schema之间的互通性。便捷性:现有资源描述schema主要依靠专家手动生成,约束条件来自两个方面:平台的定制化需求和本体的知识集约束。手动构建十分繁琐。资源描述——构建模型在假设知识集足够完善的情况下,可以基于本体和专家输入的需求自动生成资源描述schema,满足定制化、互通性和便捷性。语义搜索研究现状架构语义搜索——研究现状语义搜索方法可以被分类为:基于结构化语言的查询以SHOE,Swoogle为代表的的结构化语言查询以知识库或者本体为基础,查询输入为树形或者RDF形式,要求用户具有一定的相关背景知识。基于关键词的查询以SemSearch、Falcons、QUICK为代表要求用户输入一个或者多个关键词,然后将这些词映射到本体中,然后根据模板形成查询请求。基于自然语言的查询以PowerAqua为代表基于自然语言的查询应该是查询的终极目标,使查询更加智能化,更加人性化。语义搜索——现状分析自然语言包含关键词,同时也可以蕴含着关键词之间的结构关系。自然语言的退化就是关键词检索,完整的自然语句既包含了关键词信息又包含了词汇之间的语法结构关系。自然语言具备关键词查询无需具备专业知识的优点。同时自然语言查询又具有结构查询的结构关系,加入关键词之间的结构信息,使查询倾向更加确定。选用语义网中的RDF三元组作为自然语言抽取后的表示形式,可以很好的表达自然语言的语义。语义搜索——架构关键技术——语义抽取RDF(ResourceDescriptionFramework)是一个处理元数据的XML应用,所谓元数据,就是“描述数据的数据”或者“描述信息的信息”。用于语义物联网中的资源描述,能很好地描述资源。RDF三元组也能够完全包含一个句子中的信息。RDF三元组包含三个组成部分:主语,这是一个RDFURI引用或空白节点,即一些资源。谓语,这是一个RDFURI引用,代表一定的关系宾语,这是一个RDFURI引用,文字或空白节点,即一些资源或价值。一个RDF三元组通常写成(主体,谓语,宾语)。谓词也被称为主语的属性。一个正常的查询语句包含主语,谓语,宾语和修饰成分(定语,状语,补语等)等关键组成部分。一个或多个三元组能很好的表达一个句子的所有意思,句式是有限的,我们可以总结一些规则和模板来提取三元组。关键技术——查询拓展与规则推理推理拓展包括词意拓展和结构拓展词意拓展:词意拓展可以根据现有的一些词典库和概念结构库来拓展查询词语的意思,比如WordNet。结构拓展:RDF描述的资源是有层次结构的,自然语言输入的查询也有一定的语义结构,对输入的查询语言进行一定的结构拓展能更好的拓展用户查询意图
本文标题:语义物联网
链接地址:https://www.777doc.com/doc-2028906 .html