您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 视频图像序列中运动目标检测与跟踪
视频图像序列中运动目标检测与跟踪作者:郭海峰学位授予单位:国防科学技术大学相似文献(10条)1.学位论文任馨基于软件压缩的数字录像监控系统的研究2003多媒体视频信息的编/解码是目前多媒体技术的一个热点问题,而作为研究课题的数字录像监控系统就涉及到视频图像信息的编码和解码问题.ISO已制定出一系列视频图像压缩编码标准,该系统采用MPEG-4作为编解码标准.该文首先介绍数字视频的软件压缩标准,然后详细地介绍了MPEG-4编/解码过程,紧接着对数字录像监控系统进行介绍,重点介绍了监控系统中摄像头录入的视频图像经视频采集卡采集、量化后形成的数字信息的编码存储以及解码输出的过程.利用DirectShow提供的相关过滤器在GraphEdit中进行监控系统整体的可视化设计.该系统使用MPEG-4的DivX编解码器实现视频的编码及解码.在最后给出编码和解码算法.2.学位论文王俊AVS与H.264插值算法和加权预测部分SOC实现2007随着人们对视频图像的要求越来越高,多媒体技术的应用越来越广泛,视频压缩技术已经成为产业界关注的焦点。H.264/AVC是由ITU-TVCEG和ISO/IECMPEG两大国际组织共同制订的最新一代的视频标准。H.264/AVC具有很高的编码效率,同以往的标准相比,在计算精度和一些具体的算法上都有很大的改进。AVS协议是在中科院带头组织研发的视频标准,在和H.264/AVC协议显示效果相当的前提下降低了实现的复杂度和规模,这两个视频协议的应用前景非常广阔。由于H.264/AVC和AVS的解码复杂度很高,软件实现难以满足实时性解码的要求,本文采用SOC(System-on-a-Chip)的方法设计了兼容AVS和H.264/AVC两个视频协议的解码器。论文对H.264/AVC及AVS协议进行了详细的分析,根据两个协议的特点进行了软硬件的划分,采用自顶向下的设计方法,完成了其中的插值算法和加权预测模块的设计。为了达到实际应用中实时解码的要求,设计中采用了流水线并行设计提高运算能力,在此基础上对亮度模块和色度模块的分象素插值的可重构性进行分析,并且对色度象素采用了可重构的设计以节省面积。论文通过设计c程序模型,验证了解码算法的可实现性并为硬件实现提供仿真测试向量;并完成了两个协议的插值算法与加权预测部分硬件设计、verilog描述和功能仿真,通过了FPGA验证。并用0.18grn的SMIC工艺库进行DC综合,电路规模约10万门左右,最高频率可以达到200mhz,可对AVS和H.264/AVC的高清码流进行实时解码。3.学位论文刘春霞红外视频图像判读的预处理技术研究2003数字式视频判读系统利用多媒体技术和数字图像处理技术,分析和处理光电经纬仪的测量数据,对测量结果进行修正,是靶场光测设备测量系统的一个重要组成部分,而判读系统中最重要的部分则是图像的预处理部分,本文主要对红外视频图像预处理技术进行研究。首先介绍了判读原理和方法,根据图像特点和用户需求,提出了一种新的判读方式:中轴线判读——通过选取目标中轴线上的点作为特征点进行判读,这样判读后的目标位置一定位于目标中轴线上。由于目标中轴线的相对稳定性,使判读数据的准确性得到提高。接着讨论了系统所用的数字图像处理中平滑、阈值分割、边缘检测和形态学处理等算法,并对处理结果进行比较,选择每一种处理方法中最适合系统图像的算法。针对图像中目标周围分布不均匀弱光区的现象,本文在最大类间方差法的基础上,对该算法进行了改进,得到了一种高阈值的二值化算法,在阈值选取中能够得到较大的阈值,可有效去除目标周围的弱光区和目标后面亮度不高的拖尾部分,使目标形状和大小在图像处理后基本保持不变。最后,简要介绍了系统构成和系统流程、主要功能及相关重要问题的解决方法。4.会议论文许剑颖通讯网中的多媒体技术——真彩色视频图像在电话网中的实时传送19955.学位论文杨永玲基于超分辨率重建的视频图像压缩方法的研究2008每一个多媒体技术的使用者都期望从接收端得到清晰的良好的视频图像视觉质量,但是由于信道容量的局限,图像或视频序列通常都会被降质,从而以低分辨率进行传输和存储,这样就导致了最终视频图像视觉质量的退化。本论文的工作是研究基于超分辨率重建技术的视频图像压缩方法。在本文中,分析、设计并实现了一个基于超分辨率重建技术的视频图像压缩算法的框架,将超分辨率重建技术引入到视频压缩里。其核心思想是:在编码端,对原始高分辨率图像序列(HR)进行降采样,对得到的降质的低分辨率图像序列(LR)进行压缩;在解码端,对解压缩后的低分辨率图像序列进行超分辨率重建,得到高分辨率图像序列。在编码端,对每帧图像进行的区域分割,除了用于指导降采样过程,还将分割信息传输到解码端用于指导超分辨率重建技术过程。论文对基于超分辨率重建技术的视频图像压缩算法的关键技术如图像降采样方法和图像超分辨率重建方法方法的研究主要包括:(1)图像降采样方法。对原始高分辨率图像序列的每帧图像进行降采样,采用基于区域分割的方法,首先将每帧图像进行区域分割(分割成三类块:运动块、无运动平滑块和无运动纹理块),运动块和无运动块的分割采用基于运动性的分割方法,无运动平滑块和无运动纹理块的分割采用开明算子的分割方法。然后对不同的分割区域进行不同的降采样方法。(2)图像超分辨率重建方法。根据不同的分割区域采用不同的超分辨率重建方法,平滑块采用简单的插值技术;运动块采用基于图像配准的超分辨重建方法;纹理块采用AMR(ArtificialMotionReconstruction)的超分辨率重建方法。实验表明本算法有效可行,在基本保证图像恢复质量的同时有效地提高了压缩比。6.学位论文李树前基于MPEG-4的网络视频监控技术研究与系统实现2007随着网络和多媒体技术的不断发展,网络视频监控系统的技术己经趋于成熟。网络视频监控系统集中了多媒体技术、远程网络传输技术及多媒体播放技术等多方面的最新技术,向用户提供高质量的监控图像和便捷的监控方式。MPEG-4是一种新近成熟的、高效的视频编码标准,它有着比以往编码标准更高的压缩效率,这一特点很适合网络传输的需要,在网络视频监控系统中使用这种视频编码标准,能够给用户提供高清晰的视频图像。本文首先介绍了视频编码标准MPEG-4,然后对小波变换在MPEG-4中的静止纹理物体编码的应用作了阐述。由此,在MPEG-4视频编码技术的基础上,根据网络视频监控系统的实际应用需求进行设计,最终完成了这套网络视频监控系统。这个网络视频监控系统,具有视频图像采集、网络实时传输、云台控制、软件侦测和网络视频流回放等基本视频监控功能。文中详细描述了多线程技术在视频数据采集中的应用,重点研究了网络实时传输技术及其实现,并且根据DirectShow组件的特点和原理,设计了网络视频流的回放功能。本系统采用基于IP网络的C/S通信模式,并通过使用VisualC++6.0开发平台在Windows2000系统上实现了基于MPEG-4的网络视频监控系统,并对系统进行测试,达到了预期结果。7.学位论文张明慧基于视频图像的动态实时测量技术的实现2003基于视频图像的动态实时测量系统是利用多媒体技术和数字图像处理技术,完成对自准直经纬仪的图像数据进行的测量任务;并实时采集两台自准直平行光管内的CCD的视频信号,进行图像处理,判读出两维变形量,实现实时动态变形测量.本文研究的主要内容是基于视频图像的动态实时测量技术的实现、测量系统的开发及构成.所研究的视频图像测量系统与以往的视频测量不同的是该系统的动态实时性要求很高.以前的视频测量多为事后判读,没有实时性的要求,每秒仅处理3-6帧.而在此系统中,能够实现以20ms处理两幅图像.本文根据任务的特点及要求采用以下技术措施:1.应用北京嘉恒中自公司的MC30多路采集卡,实现2路同时采集,可达100帧/秒;2.根据图像的特点省去一些图像预处理方法,直接对图像进行二值化,可以节省很多时间.3.由于图像目标小,当系统工作在较高频率时,采用局部区域测量法来实现脱靶量的测量,以节省判读时间.本文亦讨论了数字图像处理中的各种阈值分割算法,并对实际处理结果进行比较,从而选择适合系统的二值化算法.本文的驱动程序是在WindowsNT操作平台下开发的;应用程序是基于Windows2000操作平台、在VisualC++6.0环境下研制开发的.在研制过程中,充分利用Windows2000操作系统强大的线程管理能力、丰富的消息处理函数、友好的界面等资源,编制的应用程序较好地完成了视频测量系统的图像采集及图像处理、测量数据的处理、存储、打印以及与自准直经纬仪的通讯等功能.文中研制的视频测量系统实现了高速视频采集,且可同时采集两路视频信号,进行视频信息实时监视、实时信息显示、数据实时处理以及数据记录.实现了基于视频图像的动态实时测量技术.8.会议论文张荣承.廖湖声部分求值技术在MPEG视频图像播放中的应用1997为了提高MPEG视频图像的播放速度,该文提出一种基于部分求值技术的程序优化方法,用于MPEG视频图像播放程序的开发。初步实验表明,这种方法有望提高MPEG视频图像的播放速度。9.学位论文王晓兰面向字幕帧的视频图像文本识别2009随着多媒体技术的发展,视频已成为人们获取信息的渠道。面对海量的视频数据库,如何快速有效地进行视频检索已成为研究热点。视频中的字幕信息为视频检索提供了可能。br 本文主要对视频文件中字幕帧检测和文本定位方法展开研究。首先根据梯度区域值等特征来判断视频帧图像中是否含有字幕;然后采用改进的基于形态学的文本定位方法对检测到的字幕帧图像进行字幕区域定位;为了保证视频文本识别的正常进行,在对几种图像插值算法分析的基础上,选用了适合视频图像的基于最大熵的阈值分割算法对提取出的字幕帧图像进行去噪;最后引进OCR(OpticalCharactersRecognition,光学字符识别)技术对其进行文字识别。实验表明,本文提出的方法能有效避免虚假的文本区域,对不同的视频图像有较强的适应性。10.学位论文任希波视频图像的运动估计算法与应用2005近年来,随着多媒体技术、计算机网络与通信技术的快速发展,视频数字信号的处理技术也不断地更新与发展。运动估计是视频压缩技术中最重要的组成鄙分,其搜索范围和准确性直接影响着编码的优劣。对视频序列进行压缩时,需要消除帧间的时间冗余来提高压缩效率。块匹配运动估计就是其中最常用的一种方法,它使用块匹配算法(BMA)寻找当前块在参考帧中的匹配块。如果以预测误差作为衡量标准,完全搜索方法(FS)是最好、最简单的块匹配算法。它具有高可靠性、规则的数据流和固定的运算次数,特别适合硬件实现。然而它的计算复杂性太高,搜索时间长,不适合实时应用。为此,人们提出了各种快速块匹配算法。大多数快速块匹配算法是通过限制搜索位置的数目来减少计算量的。以上的各种方法都是基于下述假设的:随着搜索位置远离全局最小点,匹配失真将单调增加。但对于实际的视频信号,这个假设不总是正确的往往会陷入局部极小点。因此要选取合适的搜索点,即要提高了匹配速度,又要减少陷入局部极小的可能性。本文首先对运动估计的原理、准则进行了深入的探讨,详细的介绍了块匹配搜索算法中全搜索法和三步搜索法及半像素搜索法,并进行比较和分析。在兼顾图像质量和搜索时间的基础上,介绍了一种对块匹配全搜索法进行改进的搜索算法一分层的块匹配搜索法。重点对分层的块匹配搜索法的粗搜索和细搜索进行阐述说明,给出了算法的硬件实现方案。并将估计的运动矢量作为摄像机的云台控制参数,完成对摄像机的自动跟踪。本文链接:授权使用:北京交通大学(北京交通大学),授权号:da6247a2-9371-4cc1-afec-9e2f01734d95下载时间:2010年11月15日
本文标题:视频图像序列中运动目标检测与跟踪
链接地址:https://www.777doc.com/doc-647323 .html