您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 基于概率主题模型的物联网服务发现20
软件学报ISSN1000-9825,CODENRUXUEWE-mail:jos@iscas.ac.cnJournalofSoftware,2014,25(8):1640−1658[doi:10.13328/j.cnki.jos.004661]©中国科学院软件研究所版权所有.Tel/Fax:+86-10-62562563基于概率主题模型的物联网服务发现∗魏强1,2,金芝1,3,许焱1,21(中国科学院数学与系统科学研究院,北京100190)2(中国科学院大学,北京100049)3(高可信软件技术教育部重点实验室(北京大学),北京100871)通讯作者:金芝,E-mail:zhijin@pku.edu.cn摘要:针对物联网中服务数量的大规模性、服务描述的异构性以及设备服务的资源高度受限性和移动性等特点,提出了一种基于概率主题模型的物联网服务发现方法.该方法的主要特点是:1)利用英文Wikipedia构建高质量的主题模型,并对类似短文本的服务文本描述进行语义扩充,使主题模型能够更有效地估计服务文本描述的隐含主题;2)提出利用非参数主题模型学习服务文本的隐含主题,降低模型训练时间;3)利用服务隐含主题对服务进行自动分类和文本相似度计算,快速减少服务匹配数量,加速服务文本相似度计算;4)提出能够同时支持WSDL-based和RESTful两种物联网服务的signature匹配算法.实验结果表明:与现有的物联网服务发现方法相比,该方法的准确率(precision)和归一化折损累积增益(NDCG)都有较大幅度的提高.关键词:物联网;服务发现;主题建模;短文本扩充中图法分类号:TP311中文引用格式:魏强,金芝,许焱.基于概率主题模型的物联网服务发现.软件学报,2014,25(8):1640−1658.英文引用格式:WeiQ,JinZ,XuY.ServicediscoveryforInternetofthingsbasedonprobabilistictopicmodel.RuanJianXueBao/JournalofSoftware,2014,25(8):1640−1658(inChinese).(AcademyofMathematicsandSystemsScience,TheChineseAcademyofSciences,Beijing100190,China)2(UniversityofChineseAcademyofSciences,Beijing100049,China)3(KeyLaboratoryofHighConfidenceSoftwareTechnologiesofMinistryofEducation(PekingUniversity),Beijing100871,China)Correspondingauthor:JINZhi,E-mail:zhijin@pku.edu.cnAbstract:Internetofthings(IoT)containsnotonlylargenumberofserviceswithheterogeneousdescriptionbutalsomobileandhighlyresource-constraineddevices.ItiskeyissueforIoTtofindsuitableservicesefficientlyandfast.ThispaperproposesaservicediscoveryapproachbasedonprobabilistictopicmodelforIoT.Thekeyfeaturesofthisapproachinclude:1)usingtheEnglishWikipediatotrainatopicmodelwithhighqualityandsemanticallyenrichservicetextdescription(aformofshorttext)tohelpthetopicmodeltoextractlatenttopicsofservicemoreeffectively;2)employingnon-parametrictopicmodeltoinferlatenttopicsofservice,whichreducesthetrainingtimeofthetopicmodel;3)makingfulluseofthelatenttopicsofservicetoautomaticallyclassifyserviceandcalculatethetextsimilaritybetweenservicerequestandservice,whichrapidlydecreasesthenumberofservicesforlogicsignaturematchmakingandacceleratessimilaritycalculationofservicetextdescription;4)providingalogicsignaturematchmakingmethodwhichsupportsbothWSDL-basedandRESTfulWebservice.Theexperimentalresultsshowthattheproposedmethodperformsmuchbetterthanexistingsolutionsintermsofprecisionandnormalizeddiscountedcumulativegain(NDCG)measurementvalue.Keywords:Internetofthings;servicediscovery;topicmodeling;shorttextenrichment∗基金项目:国家自然科学基金(61232015,91318301)收稿时间:2014-01-05;定稿时间:2014-04-29魏强等:基于概率主题模型的物联网服务发现1641物联网(Internetofthings,简称IoT)是指物物相连的互联网,它将互联网扩展到物理世界中,通过射频识别(radiofrequencyidentification,简称RFID)、传感器、全球定位等信息传感技术,按约定的协议,把物理世界中的物体与互联网相连接,进行信息交换和通信,从而实现对物体的智能化识别、定位、跟踪、监控和管理.为使物联网系统中的异构设备进行互相通信与协作,面向服务的架构(serviceorientedarchitecture,简称SOA)将设备的功能封装为松散耦合的Web服务(称为设备服务),以一种统一的接口向外界提供,从而使各种异构的设备之间、设备与传统Web服务之间能够相互通信与协作.本文将设备服务和传统Web服务统称为物联网服务.与传统Web服务相比,设备服务具有不同的特点.首先,设备服务嵌入在物理设备中,且能够提供实时数据,反映物理世界的状态,而传统Web服务是封装了业务功能的虚拟实体;其次,设备服务部署在资源受限的设备中(比如有限的计算和存储能力、带宽和电池等),而传统Web服务部署在资源丰富的计算机中;昀后,由于物联网中设备的资源有限性和移动性以及无线网络自身的不可靠性,设备服务往往处于高度动态变化的环境中,服务经常消失或重新出现,而传统Web服务变化相对不频繁.随着RFID、无线传感技术、嵌入式设备和移动智能设备技术的快速发展和物理设备的廉价化,越来越多的物理设备将被连接到物联网中.如何从大量的、资源受限的异构设备中发现具有特定功能的服务来满足用户的需求,显得越来越重要.由于设备服务与传统Web服务相比具有不同的特点,传统Web服务发现方法不能有效地满足物联网服务发现的需求.首先,物联网服务数量规模较大.与传统的Web服务发现相比,物联网中的服务发现具有更大规模的搜索空间,需要一种高效、快速且能自动对服务进行分类管理的服务发现方法.现有的Web服务发现方法仅局限于小规模的服务发现.其次,设备服务具有动态的可获取性.由于无线网络自身的不可靠性、设备故障或损坏、设备的移动性以及设备的资源高度受限性等因素,服务经常消失或重新出现,即,服务具有动态的可获取性,对服务发现的实时性要求较高.现有的Web服务发现方法主要强调服务匹配的精确度,而未考虑匹配的实时性.第三,物联网服务具有异构的服务描述模型.由于设备种类和所具有资源量的异构性,不同的设备所提供的服务具有异构的服务描述模型,比如DPWS(deviceprofileforWebservices)(),RESTfulWeb服务等.此外,物联网系统中还包括基于WSDL(Webservicedescriptionlanguage)的传统Web服务,需要一种能够处理多种异构服务描述的服务发现方法.而现有的Web服务匹配方法仅基于WSDL模型或者基于RESTful服务模型进行匹配,缺少一种能够同时支持这两种服务的通用服务发现方法.针对物联网服务发现的上述特点,本文提出一种高效、快速的基于概率主题模型的物联网服务发现方法.该方法利用英文Wikipedia构建高质量的主题模型,同时将类似短文本的服务文本描述扩充为长文本,使主题模型能够准确地估计服务文本描述的隐含主题;然后,利用非参数主题模型层次狄利克雷过程(hierarchicalDirichletprocess,简称HDP)[1]提取服务文本的隐含主题,并根据其隐含主题对服务进行自动分类,快速缩小搜索范围和加速文本相似度计算;随后,再通过计算服务与服务请求的主题相似度来进一步减小服务匹配数量;昀后,提出一种能够同时支持WSDL-based和RESTful两种物联网服务的signature匹配方法,通过计算候选服务集与服务请求的signature相似度,找到与服务请求昀相似的服务集合.本文第1节分析物联网服务发现的相关工作.第2节对概率主题模型进行介绍.第3节详细介绍基于概率主题模型的物联网服务发现方法.第4节给出对比实验,并对实验结果进行分析.第5节对全文进行总结.1相关工作目前,与物联网服务发现相关的工作主要包括探讨物联网服务发现所面临的挑战和具体的服务发现方法两个方面.Zhang等人[2]讨论了物联网服务发现所面临的可能挑战.他们认为,物联网具有超大规模搜索空间和实时性的特点,为了支持实时搜索,可以采用基于上下文的搜索机制来缩小搜索空间,从而缩短搜索响应时间,并节省资源受限设备的能量.Valerie等人[3]从可扩展性、服务描述的异构性以及设备服务的移动性等方面分析了物联网服务发现面临的挑战.他们认为,选取合适的服务发现架构以及对服务进行有效的分类,能够有效地解1642JournalofSoftware软件学报Vol.25,No.8,August2014决物联网中的大规模服务发现问题.其次,为了解决设备资源的有限性导致的服务不可获取性问题,需要设计一种高效的服务发现方法.在之前的工作中,我们分析了将传统Web服务发现方法应用于物联网服务发现中(特别是设备服务发现)的可行性与局限性,并认为:对于具有较大规模搜索空间、异构服务描述以及设备资源高度受限等特点的物联网服务发现而言,构建一个高效、实时的轻量级语义服务发现方法至关重要[4].在具体的物联网服务发现方法方面,Guinard等人[5]主要从减小设备资源消耗的角度出发,讨论了两种适用于设备服务的轻量级服务描述模型,并给出了相应的服务发现
本文标题:基于概率主题模型的物联网服务发现20
链接地址:https://www.777doc.com/doc-1589108 .html