您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 机器人室内定位技术说明书
新型机器人室内定位技术XXX软件研究所有限公司一,技术背景机器人六十年代,自第一台机器人装置诞生以来,机器人的发展经历了一个从低级到高级的发展过程。第一代机器人为示教再现型机器人,是通过计算机来控制多自主的机械装置,通过示教存储程序把信息读取出来并发出指令,也可以根据人示教的结果再现动作,它对于外界的环境没有感知能力。在20世纪70年代后期人们开始研究第二代机器人:带感觉的机器人。这种机器人有类似人类的力觉、触觉、听觉、视觉等。第三代机器人是智能机器人,它是当今机器人发展的热点和重点,机器人通过各种传感器获取环境信息,利用人工智能识别、理解、推理并进行判断和决策来完成一定的任务。因此智能机器人除了具有感知环境和简单的适应环境能力外,还具有较强的识别理解能力和决策规划能力。80年代中期,技术革命的第三次浪潮冲击着全世界,机器人总数每年以30%以上的速度增长。1986年国家把智能机器人课题列为高技术发展计划,进入90年代,在国内市场经济发展的推动下,确定了机器人及其应用工程并重、以应用带动关键技术和基础研究的发展方针,实现了高技术发展与国民经济主战场的密切衔接,研制出有自主支持产权的工业机器人系列产品,并小批量试产,完成了一批机器人应用工程,建立了9个机器人产业化基地和7个科研基地。通过多年的努力,取得了举世瞩目的硕果。本公司的智能移动机器人具备超声、红外等多传感器融合的导航系统,可以在一定的室内环境中自由行走,实现定位与自动避障等功能,在国内处于先进水平,具有一定影响力。随着机器人技术的发展,具有移动行走功能、环境感知能力以及自主规划能力智能移动机器人得到了各国研究人员的普遍重视,特别是在20世纪八、九十年代,随着计算机技术、微电子技术、网络技术等的快速发展,机器人技术的发展突飞猛进。本公司的智能移动机器人的重要特点在于它的自主性和适应性。自主性是指它可以在一定的环境中,不依赖外部控制,完全自主地执行一定的任务;适应性是指它可以实时识别和测量周围的物体,并根据环境变化,调节自身参数、动作策略以及处理紧急情况。随着智能移动机器人技术的发展,其在军事、医疗、商业等领域发挥着重要的作用,人们对智能移动机器人的需求和期望也越来越高,越来越迫切,移动机器人研究从而进入了崭新的发展阶段。定位技术是智能移动机器人的研究核心,同时也是其实现完全自动化的关键技术。机器人只有准确知道自身位置,工作空间中障碍物的位置以及障碍物的运动情况等信息,才能安全有效地进行移动,由此可见,自主定位和环境分析是移动机器人最重要的能力之一。本公司的机器人室内定位技术是用于机器人在室内环境中定位。此项技术的概念是通过场景主旨(Gist)和视觉显著性(Saliency)模型算法,逼真,精确地模拟人脑的神经元以及视觉行为体系,希望机器人从未知环境的未知地点出发,在运动过程中通过反复获取、观测周围环境的特征信息,从而定位自身的位置。二,技术内容2.1高斯金字塔高斯金字塔是在图像处理、计算机视觉、信号处理上使用的一项技术。本质上是信号的多尺度表示方法,亦即将同一信号或图片多次的进行高斯模糊,并且向下取样,从而产生不同尺度下的多组信号或图片用于后续处理。例如在影响辨识上,可以通过对比不同尺度下的图片,防止要寻找的内容在图片上有不同的大小。高斯金字塔的理论基础是尺度空间理论。给定一张图片f(x,y),它的尺度空间表示方式L(x,y;t)定义为:影像信号f(x,y)和高斯函数的旋积。完整的表达式如下:其中分号代表旋积的对象为x,y,而分号右边的t表示定义的尺度大小当t0是对于所有的t都会成立,不过通常只会选取特定的t值。其中t为高斯函数的变异数,当t越接近零的时候,使得L(x,y;t)=f(x,y),这代表t=0的时候我们把这项操作视为图片f本身,当t增加时,L表示将影像f通过一个较大的高斯滤波器,从而使得影像的细节被去除更多。在建立高斯金字塔时,我们首先会将影像转换为尺度空间的表示方式,即乘上不同大小的高斯函数,之后再一句取定的尺度向下取样。乘上的高斯函数大小和向下取样的频率通常会选为2的幂次。所以,在每次迭代的过程中,影像都会被乘上一个固定大小的高斯函数,并且被以长宽各0.5的比率被向下取样。如果将向下取样过程的图片一张一张叠在一起,就会呈现一个金字塔的样子,因此这个成果称为高斯金字塔。2.2尺度不变特征转换(SIFT)SIFT是一种用于侦测与描述影像中局部性特征的视觉算法,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变数,其应用范围包含物体辨识、机器人地图感知与导航、影像缝合、3D模型建立、手势辨识、影像追踪和动作比对。局部影像特征的描述与侦测可以帮助辨识物体,SIFT特征是基于物体上的一些局部外观的兴趣点而与影像的大小和旋转无关。对于光线、噪声、些微视角改变的容忍度也相当高。基于这些特性,它们是高度显著而且相对容易撷取,在母数庞大的特征数据库中,很容易辨识物体而且鲜有误认。使用SIFT特征描述对于部分物体遮蔽的侦测率也相当高,甚至只需要3个以上的SIFT物体特征就足以计算出位置与方位。在现今的电脑硬件速度下和小型的特征数据库条件下,辨识速度可接近即时运算。SIFT特征的信息量大,适合在海量数据库中快速准确匹配。2.3主成分分析(PCA)在多元统计分析中,主成分分析是一种分析、简化数据集的技术,用于分析数据及建立数理模型。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留主数据的最重要的方面。其方法主要是通过对共变异数矩阵进行特征分解,以得出数据的特征向量它们的特征值。PCA是最简单的以特征量分析多元统计分布的方法。其结果可以理解为对源数据中的方差作出解释:哪一个方向上的数据值对方差的影响最大?换而言之,PCA提供了一种降低数据维度的有效方法;如果分析者在源数据中除掉最小的特征值所对应的成分,那么所得的低纬度数据必定是最优化的,因为这样降低维度是失去信息最少的方法。PCA是最简单的以特征量分析多元统计分布的方法。通常情况下,这种运算可以看作是揭露数据的内部结构,从而更好的解释数据的变量的方法。如果一个多元数据集能够在一个高维数据空间坐标系中被显现出来,那么PCA就能够提供一副比较低维度的图像,这幅图像即为在讯息最多的点上原对象的一个‘投影’。PCA的数学定义是:一个正交化线性变换,把数据变换到一个新的坐标系统中,使得这一数据的任何投影的第一大方差在第一个坐标上,第二大方差在第二个坐标上,以此类推。定义一个n×m的矩阵,XT为去平均值(以平均值为中心移动至原点)的数据,其行为数据样本,列为数据类别(注意,这里定义的是XT而不是X)。则X的奇异值分解为X=WΣVT,其中m×m矩阵W是XXT的本征矢量矩阵,Σ是m×n的非负矩形对角矩阵,V是n×n的XTX的本征矢量矩阵。据此,当mn−1时,V在通常情况下不是唯一定义的,而Y则是唯一定义的。W是一个正交矩阵,YT是XT的转置,且YT的第一列由第一主成分组成,第二列由第二主成分组成,依此类推。为了得到一种降低数据维度的有效办法,我们可以把X映射到一个只应用前面L个向量的低维空间中去,WL:wherewiththerectangularidentitymatrix.X的单向量矩阵W相当于协方差矩阵的本征矢量C=XXT,在欧几里得空间给定一组点数,第一主成分对应于通过多维空间平均点的一条线,同时保证各个点到这条直线距离的平方和最小。去除掉第一主成分后,用同样的方法得到第二主成分。依此类推。在Σ中的奇异值均为矩阵XXT的本征值的平方根。每一个本征值都与跟它们相关的方差是成正比的,而且所有本征值的总和等于所有点到它们的多维空间平均点距离的平方和。PCA提供了一种降低维度的有效办法,本质上,它利用正交变换将围绕平均点的点集中尽可能多的变量投影到第一维中去,因此,降低维度必定是失去讯息最少的方法。PCA具有保持子空间拥有最大方差的最优正交变换的特性。然而,当与离散余弦变换相比时,它需要更大的计算需求代价。非线性降维技术相对于PCA来说则需要更高的计算要求。PCA对变量的缩放很敏感。如果我们只有两个变量,而且它们具有相同的样本方差,并且成正相关,那么PCA将涉及两个变量的主成分的旋转。但是,如果把第一个变量的所有值都乘以100,那么第一主成分就几乎和这个变量一样,另一个变量只提供了很小的贡献,第二主成分也将和第二个原始变量几乎一致。这就意味着当不同的变量代表不同的单位(如温度和质量)时,PCA是一种比较武断的分析方法。一种使PCA不那么武断的方法是使用变量缩放以得到单位方差。通常,为了确保第一主成分描述的是最大方差的方向,我们会使用平均减法进行主成分分析。如果不执行平均减法,第一主成分有可能或多或少的对应于数据的平均值。另外,为了找到近似数据的最小均方误差,我们必须选取一个零均值。假设零经验均值,数据集X的主成分w1可以被定义为:为了得到第k个主成分,必须先从X中减去前面的个主成分:然后把求得的第k个主成分带入数据集,得到新的数据集,继续寻找主成分。PCA类似于一个线性隐层神经网络。隐含层K个神经元的权重向量收敛后,将形成一个由前K个主成分跨越空间的基础。但是与PCA不同的是,这种技术并不一定会产生正交向量。2.4独立成分分析(ICA)在统计学中,ICA是一种利用统计原理进行计算的方法。它是一个线性变换。这个变换把数据或信号分离成统计独立的非高斯的信号源的线性组合。独立成分分析的最重要的假设就是信号源统计独立。这个假设在大多数盲信号分离的情况中符合实际情况。即使当该假设不满足时,仍然可以用独立成分分析来把观察信号统计独立化,从而进一步分析数据的特性。独立成分分析的经典问题是“鸡尾酒会问题”(cocktailpartyproblem)。该问题描述的是给定混合信号,如何分离出鸡尾酒会中同时说话的每个人的独立信号。独立成分分析并不能完全恢复信号源的具体数值,也不能解出信号源的正负符号、信号的级数或者信号的数值范围。观察的数据或者信号用随机向量表示,独立成分量可以定义为向量。独立成分分析的目的是通过线性变换把观察的数据,转换成独立成分向量,而独立成分分量满足互相统计独立的特性。统计独立的量化通常通过某指定函数来衡量。2.5基于视觉显著性(saliency)模型的快速场景分析Saliency模型是受早期灵长类动物的神经结构启发提出的一种视觉注意的系统。多种不同比例的特征图形结合形成一张saliency图,然后由动态神经网络选取视觉上最引人注意的点来降低显著性。该系统将复杂的场景理解问题,分解为快速的场景选择,找出最引人注目的点。尽管灵长类动物的神经元计算能力有限,但是对复杂场景的实时理解有着非常出色的能力。所谓的‘视觉焦点’,通过两种方式扫描场景图片,一种是快速的自底向上,saliency驱动,独立于任务的方式,一种是自顶向下,缓慢,意志控制并基于任务的方式。注意力模型包括‘动态路由’模型,在这个模型中,只有视觉区域中的一小部分信息可以通过视觉皮层被处理。这些信息是通过自顶向下和自底向上控制下的皮层连接动态变化或者事件短时间模式建立的。该模型采用的是Koch和Ullman提出的第二种生物上可行的结构。模型的理论基础有许多模型。比如:特征结合理论,是对人类视觉搜索策略的一种解释。首先将视觉输入分解为一组特征图,接着空间上的不同位置会相互竞争,直到找出显著点,因此只有局部显著的点能够被保留下来。所有特征图自下而上汇总形成saliency图,这样就能找出整个场景的局部显著点。这种方式,是灵长类动物大脑的后顶叶形成的对视觉输入的处理结果图,模型的saliency图具有生成注意力转换的能力。因此此模型可以表示自底向上的saliency模型说明,而不需要自顶向下的帮助进行注意力转移。这个框架的结构,对于计算机视觉计算技术而言,提供了大量的并行方法,我们可以通过快速选取出一组图片中感兴趣的点来分析更复杂和更消耗时间的物体识别过程。Saliency模
本文标题:机器人室内定位技术说明书
链接地址:https://www.777doc.com/doc-2324879 .html