您好,欢迎访问三七文档
视频图像中人体运动目标检测算法研究参考文献:李伟熊建设.视频图像中人体运动目标检测算法研究.青岛:中国海洋大学.2013引言1运动目标检测2运动人体的识别3实验结果及分析4引言人体运动视觉分析是近年来计算机视觉领域中备受关注的前沿方向,在智能视频监控、人机交互、虚拟空间等方面有着非常广阔的应用前景。它主要针对视频图像序列进行分析处理,常涉及到运动目标检测、目标人体识别、人体跟踪及行为理解与描述几个过程。其中作为各项分析基础的人体目标检测也越来越成为研究的热点前沿课题之一。通常情况下,针对特定背景下的运动目标检测是依赖于背景模型的,因而运动检测和背景环境模型密切相关。如何使系统自适应于环境,是背景模型以及更新的核心问题,之后就可以进行运动检测。运动检测是目标分类的基础,只有检测出有效的运动区域才能进行目标分类。基于上述讨论提出了人体运动目标检测改进算法,以满足实际的需求。时间差分法背景减除法光流法运动目标检测利用图像序列中相邻帧图像之间的差分来提取出图像中的运动区域。它对于动态环境具有较强的自适应性,但是一般不能完全提取出所有相关的特征像素点,在运动物体运动较慢,相邻帧图像有重叠的情况下,提取出的运动物体不完整或比物体实际区域大,也容易在运动实体内部产生“空洞”现象。它是目前运动分割中最常用的一种方法,它利用当前图像与背景图像的差分来检测出运动区域,一般能够提供最完整的特征数据,但对于动态场景的变化,例如室内窗帘的飘动,室外树叶的摇摆等会造成提取出的目标与实际差别很大。采用了运动目标随时间变化的光流场特性,其优点是在摄像机运动的前提下也能检测出独立的运动目标,缺点是计算方法复杂,抗噪性能差,如果没有特殊的硬件设备支持则不能满足视频图像实时处理的需要。自适应混合高斯背景模型采用背景减除法虽然可以提取出完整的目标图像,但是实际应用中一幅“纯净”的背景图像总是不容易得到的,外界微小的干扰也会引起背景图像的变化,如树木的晃动、光线的变化等,这些场景下固定位置的像素值在不断的改变,呈现多模特性。所以方法的关键之一在于随着时间的推移自适应地更新背景图像。而混合高斯模型正是针对这一点,用两个或者多个高斯分布去拟合背景,对于复杂背景有着良好的效果。本文采用一种基于高斯建模的背景减除法来实现运动人体轮廓提取。不仅可以较为精确地从背景中提取出前景区域,获得运动目标信息,又对环境有一定的自适应性,算法具有比较良好的鲁棒性。本文所研究的环境是摄像头固定的情形即静态背景下的目标检测,可以采用上述方法实现背景的估计,主要从背景建模、背景更新和背景提取三个方面来实现。背景建模及初始化图像中的每个像素用K个状态来描述其颜色信息,每个状态都是独立的随机过程,服从高斯分布并使用高斯密度函数来描述,彼此相互独立,K的值根据实际需要选取,一般取3-5个。假设t时刻像素点(x,y)的观测值为Xt,第i个高斯分布的概率密度函数如下式所示:式中:,分别表示第i个高斯分布t时刻的均值和协方差。混合高斯背景模型建模还为每个高斯分布设定了权值,其影响着该单高斯分布在背景模型中所占的比例,。这样t时刻背景像素点(x,y)的概率密度函数估计为:,it,it,itW,11kitiW,,,1*,,ktittititiqXWX1,,,12,,1/2/2,1,,2TtitittitXXtititnitXe背景建模及初始化本文采用时间统计平均建模法来对混合高斯模型进行初始化。时间统计平均法是求取一段时间内图像序列中N帧图像的灰度平均值作为背景图像的估计值,以弱化运动目标对背景的干扰。设为某点初始背景估计的均值与方差,其初始值如下式:式中N为所选取的帧数。2211,(I,,)nokokxyxyxyN,,,ooxyxy11,,NokkxyIxyN背景模型的更新当读取新视频图像的像素值之后,将当前帧像素值Xt与K个高斯分布进行匹配,匹配判据为:如果像素值Xt与其中某个高斯分布的均值μi,t–1之差满足上式要求,则认为该像素值匹配这个高斯分布,否则不匹配。如果匹配,对该高斯模型进行更新:式中p为参数学习率。为了更好地适应环境的变化,还应考虑权值的更新。如果匹配,则权重增加,反之减少。权值的同步更新如下式:式中为学习率,它与背景的更新快慢有关,且小于1。数值越小更新速度越慢,反之越快。在这里取=0.005。,1,12.5tititX,,1,1itititppX222,,1,,11(X)ititititpp,,1(1)itit背景提取在完成上述过程后,当新的一帧图像到来后,根据背景更新公式利用新的像素把模型相应参数进行更新,计算其优先级并按从高到低顺序排序,在实际情况中,K个高斯分布不一定全部选为背景模型,可以选取前几个优先级较大的,取前b个值相加,当其和大于阈值T时,就可以根据下式得到背景模型:式中T为选取的阈值,其大小选取根据不同的监控场景决定,当场景相对复杂时,应选择较大的阈值T;场景比较简单就应选择较小的阈值T。背景减除法检测变化区域通过上述的混合高斯背景建模,然后就可以利用背景减除法从背景中提取出前景区域,提取人体轮廓。算法如下:设当前帧图像为fk(x,y),背景帧为fbk(x,y),则差分图像为:二值化图像为:其中T为设定的阈值,对得到的差分图像按照上式进行二值化处理,当差分图像中的某一像素大于或等于给定的阈值时,则认为该像素是前景像素点,反之,则是背景像素点。形态学处理和连通性分析由于噪声或者人体颜色与背景相近的影响,在通过上述方法进行前景检测后,在检测到的人体区域会有孔洞产生,因此可以采用形态学图像处理的方法填补目标区域的小的孔洞。其基本运算中的开运算(opening)具有消除细小目标,在纤细点处理目标和平滑大的边界又不明显改变其面积的作用,而闭运算(closing)常用来填充目标内的细小空洞,连接断开的邻近目标,平滑边界同时并不明显改变其面积。对检测出的运动目标区域做形态学运算,先进行开运算,再进行闭运算对检测结果进行去噪。在经过形态学运算之后,图像中一些小的空洞被填充,小的间隙被连接,但是一些比较大的空洞,形态学滤波往往不能完全填充,这时候需要用到连通性分析来填补这些空洞或者断开多目标之间的粘结,最后得到较为干净的前景区域。经过连通性分析后,会产生若干个连通的区域。除了一些真正的目标区域或背景区域外,还会产生一些小块的连通区域,他们不是真正的目标区域或背景区域,而是噪声点的连通集合。可以通过文中下述方法对产生的所有区域进行计算其像素值的大小(区域面积),如果超过了某一阈值才判断其为目标区域,借以消除这些噪声区域的影响。运动人体的识别区域目标面积:为了排除虚假目标的干扰,对得到的二值图像Rk的变化区域面积进行测量,当变化区域的面积在整个图像中的比值超过设定的阈值时,就认为有运动目标存在,再对它进行下一步的处理。否则,被认定为无运动目标出现,不进行下一步处理。对变化区域面积的测量采用了一种近似的方法:对二值图像Rk进行逐行扫描,统计Rk中值为1的像素个数No,再用No除以整幅图像的像素点总数N:A=No/N得到变化区域占图像总面积的近似比值。设定的阈值一般根据具体监控场景来设定,范围大致在6-10之间,通过对阈值的设定可以减少无用目标信息的干扰,并大大减少系统的运算量,提高系统的实时处理。目标的长宽比:由于人体的形状可以近似为其最小外接矩形,可以对得到的区域求其最小外接矩形。采取方法是:对保留区域从左到右、从上到下进行扫描,得到所在区域的上下左右最边上的点,分别记Ynt,Ynb,Xnl,Xnr,n表示第n个运动目标,(Xnl,Ynt)表示左上点,(Xnl,Ynb)表示左下点,(Xnr,Ynt)表示右上点,(Xnr,Ynb)表示右下点。并求每个最小外接矩形的长宽比为:C=Lnx/Lny本文假设场景中的行人都处于直立状态,直立状态的行人虽然有高、矮、胖、瘦之分,但高度和宽度一般符合一定的比例。根据先验知识,可知其高度、宽度比的范围大体在1.5-5之间,将长宽比值C与这一范围做比较,就可以判断该目标是否符合人体长宽比的特征,从而来进行识别。实验结果及分析实验是在VC++平台上,基于OpenCV的图像处理函数完成的,实验所用的视频为使用普通摄像头拍摄的320×240的视频序列。实验结果如下图所示。改进前的检测结果上左下角图所示,所获取的整体轮廓不完整,对于人的外观与背景的颜色有相近的部分,无法准确提取相关特征点的信息,而且在运动物体的内部容易产生一些空洞现象,出现部分区域的漏检。采用本文提出的方法最终提取的人体目标轮廓如上右下角图所示,将目标和背景正确地进行了分割,得到了鲁棒的实验结果。实验结果表明,采用本文提出的目标检测方法可以形成一个完整的目标轮廓和保证运动目标的连通性,具有较好的运动目标检测效果,为后期的运动目标跟踪、运动目标行为识别奠定了良好的基础。谢谢!
本文标题:运动目标检测1
链接地址:https://www.777doc.com/doc-6148201 .html