您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 贝叶斯目标跟踪方法的研究
—137—贝叶斯目标跟踪方法的研究郭晓松,李奕芃,郭君斌(第二炮兵工程学院202教研室,西安710025)摘要:针对贝叶斯滤波过程中存在的目标跟踪问题,提出几种典型的贝叶斯滤波方法,如EKF,UKF,PF和UPF等,基于这些方法所构建的框架,对它们进行性能测试和比较,并在非线性环境下,讨论这些方法的特点,仿真实验结果表明,在非线性非高斯环境下,UPF方法的性能是最优的。关键词:目标跟踪;贝叶斯滤波;非线性滤波方法ResearchonBayesianTargetTrackingMethodGUOXiao-song,LIYi-peng,GUOJun-bin(202StaffRoom,TheSecondArtilleryEngineeringCollege,Xi’an710025)【Abstract】AimingattheproblemoftargetrackinginBayesianfilteringprocess,sometypicalBayesianfilteringmethodssuchasEKF,UKF,PFandUPFareproposed.Onbasisoftheframeworkssetupbythesemethods,theperformanceofthesemethodsaretestedandcompared,andthecharacteristicsofthemarediscussedinnon-linearenvironment.Simulationexperimentalresultsshowthat,innon-linearandnon-Gaussianenvironment,theperformanceofUPFisthebest.【Keywords】targettracking;Bayesianfiltering;non-linearfilteringmethod计算机工程ComputerEngineering第35卷第12期Vol.35No.122009年6月June2009·人工智能及识别技术·文章编号:1000—3428(2009)12—0137—03文献标识码:A中图分类号:TP3911概述目标跟踪在交通管制、机器智能、医疗器械、军事上的战场监视、防空系统等众多领域中都有广泛应用,它是在捕获到的目标初始状态和通过特征提取得到的目标特征基础上,进行一种时空结合的目标状态估计[1]。目前,就跟踪的数学方法而言,有非贝叶斯方法和贝叶斯方法。非贝叶斯方法基于似然函数,在没有任何先验知识的情况下,利用已知的若干观测值估计未知参数。贝叶斯方法将未知参数看作是随机变量,使用先验概率和当前观测信息计算后验概率。贝叶斯方法是协调先验信息和当前信息的一个统一方法,适用于处理非线性和非高斯系统的状态估计问题,因此,具有较高的实际应用价值。2基于贝叶斯框架的跟踪问题描述为描述跟踪问题,定义目标状态空间模型为1(,)(,)kkkkkkkkxfxvyhxw−⎧⎨⎩==(1)其中,xnkxR∈表示k时刻系统状态;ynkyR∈表示量测;,vwnnkkvRwR∈∈分别为独立同分布的系统噪声和量测噪声序列。从贝叶斯估计的角度来看,跟踪问题就是从所有得到的量测信息1:12{,,,}kkyyyy=中推理出k时刻状态变量kx的值,即:估计后验概率1:(|)kkpxy。根据贝叶斯定理,假设kx服从一阶Markov过程,量测序列ky相互独立,初始状态0x的先验分布为000(|)()pxypx=,那么状态预测方程为1:1111:11(|)(|)(|)dkkkkkkkpxypxxpxyx−−−−−=∫(2)状态更新方程为1:11:1:1(|)(|)(|)(|)kkkkkkkkpyxpxypxypyy−−=(3)其中,1:11:1(|)(|)(|)dkkkkkkkpyypyxpxyx−−=∫(4)在得到后验概率1:(|)kkpxy后,根据某些准则,如极大似然估计、最小均方误差估计、最大后验估计等,就可计算出目标的状态值。式(2)、式(3)描述了一种求后验概率的递推方法,通常称为贝叶斯滤波。根据不同的假设,使用不同的方法求解这2个方程,就得到各种不同的贝叶斯滤波算法。3非线性滤波算法当噪声分布为高斯分布,且状态方程与量测方程为线性时,卡尔曼滤波可得到最优估计值。但实际的系统往往是非线性、非高斯、非平稳的,卡尔曼滤波器难于找到解析解,因而必须求助于次优或逼近算法以获得次最优的解。目前,主要的方法可分为2类:高斯逼近和蒙特卡罗方法。3.1高斯逼近法设系统模型的概率分布服从高斯分布或者可以用高斯分布进行有效的逼近。根据逼近方法的不同,主要有扩展卡尔曼滤波(ExtendedKalmanFilter,EKF)和不敏卡尔曼滤波(UnscentedKalmanFilter,UKF)。3.1.1扩展卡尔曼滤波EKF是传统非线性估计的代表[2],其基本思想是对非线性模型进行一阶泰勒展开,然后对线性化后的系统模型应用卡尔曼滤波公式。令:基金项目:国家自然科学基金资助项目(60675019);第二炮兵工程学院科技创新基金资助项目(XY2008JJ07)作者简介:郭晓松(1957-),男,教授、博士生导师,主研方向:计算机视觉,模式识别;李奕芃,硕士研究生;郭君斌,博士研究生收稿日期:2009-01-20E-mail:li_yipeng@163.com—138—1|1|1d()|dd()|dkkkkkkkkfxFxxxhxHxxx−−−⎧==⎪⎪⎨⎪==⎪⎩(5)状态空间模型就成为11|11|11|11|1()()(())kkkkkkkkkkkkkkkkkkkkxFxxxxFxvfyHxwhH−−−−−−−−−−⎧⎪⎨⎪⎩=++=++−(6)其中,kv和kw为零均值;协方差分别为kQ和kR的高斯白噪声。EKF算法的步骤如下:11:111|11|11:1|1|11:||;,;,(|)()(|)()(|)(;,)kkkkkkkkkkkkkkkkkkkkkxxpxyNxPpxyNxPpxyNxxP−−−−−−−−−−⎧⎪⎨⎪⎩===(7)其中:|11|1|111|11|1|1||1|1||1()()(())()kkkkkTkkkkkkkTTkkkkkkkkkkkkkkkkkkkkkkkkxfxPQFPFKPHRHPHxxKyhxPIKHP−−−−−−−−−−−−−=⎧⎪=+⎪⎪=+⋅⎨⎪=+−⎪⎪=−⎩(8)EKF的主要缺陷有:(1)必须满足小扰动假设,即只适合弱非线性系统,对于强非线性系统,滤波性能极不稳定,甚至发散;(2)必须计算Jacobian矩阵及其幂,这是一件计算复杂、极易出错的工作。3.1.2不敏卡尔曼滤波UKF不是对非线性模型做近似,而是对状态的概率密度函数用高斯分布进行近似。它是基于采样的方法,以确定性的方式选择一组近似高斯分布的σ样本点,这些点经过真实非线性方程变换,得到一簇变换后的点,将它们的均值和方差经过加权处理,可求出非线性系统状态估计的均值和协方差。UKF核心是U变换,基本算法如下:(1)选择样本点1101|11|11|11|11|11|1(()),1,2,(()),1,2,kkkkkkikkkkiLkkkkxxLPiLxLPiLλλχχχ−−−−−−−−−−+−−−−⎧=⎪⎪=+=⎨⎪=+=⎪⎩+−,,(9)其中,L是状态变量的维数;1kx−和1kP−分别是状态的期望和协方差;κ是控制期望范围的尺度参数。λ可以用下式表示:2()LLλακ=+−(2)计算权值020/()/()(1)1/(2()),1,2,2mcmciiWLWLWWLiLλλλλαβλ⎧⎪⎨⎪⎩=+=++−+==+=,(10)权值满足201LiiW==∑,α和β是控制分布曲线展开范围的尺度参数。(3)时间更新|11|12|1|102T|11|1|11|1|10()()(,)iikkkkkkLmikkikkiLciikkikkkkkkkkkiPQfvxWWxxχχχχχ−−−−−=−−−−−−−=⎧⎪⎪⎪=∑⎨⎪⎪=−−+∑⎪⎩=(11)(4)量测更新|1|12|1|102T|1|1|1|10(,)()()iikkkkkLmikkikkiLciiyikkkkkkkkihwyPyyWWξξξξχ−−−−=−−−−=⎧=⎪⎪⎪=∑⎨⎪⎪=−−∑⎪⎩(12)(5)计算滤波增益2T|1|1|1|101()()LciixyikkkkkkkkikxyyPyKPPWxξχ−−−−=−⎧=−−∑⎪⎨⎪=⎩(13)(6)输出||1|1||1()kkkkkkkkTkkkkkykxxKyyPPKPK−−−=+−⎧⎪⎨=−⎪⎩(14)(7)计算先验和后验概率0:1|1|10:||ˆˆ(|)(;,)(|)(;,)kkkkkkkkkkkkkkppxyNxxPxyNxxP−−−⎧⎪⎨⎪⎩==(15)UKF有以下几个特点:(1)可以准确估计均值和协方差达到泰勒级数的二阶精度;(2)由于σ点俘获到的均值和协方差不会因采取不同的平方根分解方法而改变,因此可以采用效率高、鲁棒性强的Cholesky分解方法,在实时应用场合这将显得尤为重要;(3)经过U变换后就不需计算状态方程与量测方程的Jacobian矩阵,实现相对简单;(4)因为UKF仍是用高斯分布来逼近系统状态的后验概率密度,所以在系统状态的后验概率密度非高斯的情况下,滤波结果将有较大误差。3.2蒙特卡罗方法EKF和UKF都是递推滤波算法,其基本思想是通过采用参数化的解析形式对系统的非线性进行近似,而且都是基于高斯假设。在实际情况中非线性、非高斯随机系统估计问题更具普遍意义,解决这一问题的一种有效方法是进行MonteCarlo模拟。主要方法包括粒子滤波(ParticleFilter,PF)及其改进算法。3.2.1粒子滤波粒子滤波是一种通过非参数化的蒙特卡罗模拟实现递推贝叶斯估计的算法[3],它通过寻找一组在状态空间中传播的随机样本利用加权样本均值对后验概率密度函数进行近似,每个样本(也被称为“粒子”)代表系统的一个可能状态,当样本数非常大时,算法精度逼近最优估计。令1,{}iiNkkixω=表示一组随机粒子,其中,ikω为归一化后的权值,那么后验概率可近似为0:1:0:0:1ˆ(|)()Niikkkkkixxpxyωδ==−∑(16)10:1:0:1:(|)(|)iikkNikiiikkkikkpxyqxyωωωω=⎧⎪⎪⎪⎨⎪⎪⎪⎩=∑∝(17)其中,ikω称为重要性权值;0:1:(|)ikkqxy是重要性分布函数,可做如下分解:010:11:10:11:()=(|)(|,):k:kkkkkkqx|yqxyqxxy−−−(18)此时重要性权值就成为11,0:11:(|)(|)(|)iiiiikkkkkkiikkkpyxpxxqxxyωω−−−∝(19)式(16)~式(19)被称为SIS(SampleImportanceSample)方—139—法。对式(18)的重要性函数,重要性权的方差随时间增加,在极端情况下,容易导致退化现象(degeneracy)。减小这一不利影响主要有3种方法:(1)增加粒子数,但这通常是有限度的,而且容易导致算法的计算量过大;(2)选择好的重要性密度函数,选取重要性函数的准则是使重要性权值的方差最小,最优重要性函数为0:11:1(|,)(|,)iikkkkkkqxxypxxy−−=,实践中常采用转移概率分布1(|)ikkpxx−作为重要性函数,此时,1(|)iiikkkkpyxωω−=;(3)进行重采样,重采样的基本思想是消除小权值粒子而保留并复制大权值粒子。方法是以概率1,2{;}ikNiω=,,从0:1,2{;}ikNxi=,,中再均匀的替补采样,得到新的粒子集*0:1,2{;}ikiNx=,,,并重新赋予权值1/ikNω=。SIS和重采样就构成SIR(SampleImportanceResample)方法,通常被称为粒子滤波器。PF不受模型的线性和高斯假设约束,简单易行且经过重采样在一定程度上遏制了退化问题,但是粒子
本文标题:贝叶斯目标跟踪方法的研究
链接地址:https://www.777doc.com/doc-5420746 .html