您好,欢迎访问三七文档
当前位置:首页 > 机械/制造/汽车 > 汽车理论 > 基于机器视觉的标签动态检测识别
河北工业大学硕士学位论文基于视觉的标签动态检测识别系统研究及应用姓名:王增春申请学位级别:硕士专业:机械制造及自动化指导教师:李铁军20061101基于视觉的标签动态检测识别系统研究及应用摘要光学字符识别(OCR)研究是当前机器视觉领域的研究热点,有着广泛的应用前景。本文进行的研究首先是基于机器视觉的基本理论和发展现状,讨论了机器视觉在各个领域的应用情况;其次,按照机器视觉系统的逻辑结构,探讨了机器视觉字符识别系统各部分的设计方法,并在此方法的指导下实现了中国印钞造币总公司石家庄印钞厂项目“PL-1000A包装装箱生产线”中基于视觉的产品标签动态检测识别系统部分的设计,并将视觉识别系统成功应用于PL-1000A包装装箱生产线系统中,保证了产品标签识别校验的准确性和可靠性。论文主要内容如下:介绍了字符识别系统的工作原理,并分析了字符识别的常用方法。根据项目的具体要求全面分析了并论证了标签动态检测识别系统的具体指标及可行性。提出了视觉系统的构建方案,并针对项目实施的具体要求对识别系统主要硬件进行了选型设计。针对产品标签动态采集过程中出现的图像模糊问题,提出相应的解决方法对标签图像进行恢复,提高了识别输入图像的品质。并根据产品标签上识别对象特征提出了针对性的图像分割解决方案,解决了字符识别预处理阶段对任意放置的标签定位、区域分割及单个字符提取等问题。基于图像识别技术的基础理论,分析了数字识别的方法,针对标签中数字在印刷时有可能存在数字之间粘连以及结构存在残缺的问题,在本系统中提出了采用数字字符轮廓特征和统计特征相结合的方法,不仅克服了上述的问题,而且还能够实现多种字体数字的准确识别,同时还提高了识别的速度。从软、硬件两方面详细介绍了PL-1000A包装装箱生产线系统的集成方法,并对硬件结构及软件功能模块做了简单介绍。通过大量实验,详细分析了标签动态检测识别系统误识原因并提出了相应的解决方法,从而最终保证了产品标签动态检测识别系统在PL-1000A包装装箱生产线上的成功应用。关键词:机器视觉,动态检测识别,图像恢复,标签,集成(OCR)isahotspotofmachinevision,andithasacomprehensiveforegroundofapplications.Firstly,thebasictheoryanddevelopmentstatusofmachinevisionisintroducedinthispaper.Secondly,thedesigntechniquefordifferentpartofmachinevisionsystemisdiscussedaccordingtothesystem’slogicalstructure.Andthen,thedynamicdetectionandrecognitionsystemoflabelbasedonvisionoftheprojectnamed“PL-1000Apackingproducingline”wasturnedtorealitywiththedesigntechnique’sguidanceandputintooperationsuccessfullyinthePL-1000Apackingproducinglinesystem.Themainresearchworksareasfollows:TheworkingprinciplesofOCRsystemareintroducedanditsnormalmethodsareanalyzedinthispaper.Theparticularspecificationsandfeasibilityoflabeldynamicdetectionandrecognitionsystemareanalyzedanddemonstratedcomprehensivelyaccordingtothepracticalrequirements.Theframeworkofthelabeldynamicdetectionandrecognitionsystemisputforward,andthenthedesignofmainhardwareisintroduced.Accordingtothemotion-blurprobleminlabeldynamicimageacquisition,acorrespondencerestorationmethodisintroducedindetailtoimprovethequalityofinputimage.Animagepre-processingprocedureisdiscussedtoresolvethearbitraryplacementoflabel,thecharacterregionsegmentationandsinglecharactersegmentationsuchaseriesproblemsaccordingtothelabelspecifications.Themethodsofdigitsidentificationhavebeenanalyzedbasedonthebasistheoryofimageidentificationtechnology,aimingattheproblemwhichpossiblyexistconglutinationbetweendigitsinlabelanddigitstructureexistdeformitywhenprinting,thisarticleputtedforwardthemethodwhichthedigitsoutlinecharacteristicandstatisticalcharacteristiccombined,itnotonlyovercomemanyproblemsbutalsocanrealizeaccuratelyidentificationofdigitsofmanykindsoftypefaces,andenhancedtheidentificationspeedatthesametime.TheintegrationofthePL-1000Apackingproducinglinesystemwithlabeldynamicdetectionandrecognitionisintroducedfromthehardwareandsoftwareaspects.Toreducethemiss-recognitionratio,somecorrespondingwaysarediscussedandfoundbymanyexperiments.Alloftheseworksguaranteethattheapplicationofthedynamicdetectionandrecognitionsystemoflabelissuccessful.KEYWORDS:machinevision,dynamicdetectionandrecognition,imagerestoration,label,integration原创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。学位论文作者签名:日期:关于学位论文版权使用授权的说明本人完全了解河北工业大学关于收集、保存、使用学位论文的规定。同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:日期:导师签名:日期:第一章绪论§1-1引言人类感知外部世界主要是通过视觉、触觉、听觉和嗅觉等感觉器官,而视觉,是人类昀重要的感觉功能。据统计,人所感知的外界信息有80%以上是由视觉得到的[1]。计算机视觉又称为机器视觉,机器视觉主要研究用计算机来模拟人的视觉功能,从客观事物的图像中提取信息,进行处理并加以理解,昀终用于实际检测、测量和控制[2]。机器视觉技术是近几十年来发展的一门新兴技术。机器视觉是研究使机器具有类似于生物视觉部分功能的—门新兴学科。因此在工业过程质量检测、监控、非接触位置与几何测量、视觉伺服控制、机器人自主行为规划、机器人遥操作、透视3D成像、反求工程、遥现与遥视等研究与工业领域有着不可替代作用和巨大的发展前景。计算机视觉的主要目标是用图像来创建和恢复现实世界模型,然后认知现实世界。简单的说,计算机视觉就是使机器具备“看”的功能,使机器能认识和看懂所要看的东西,能确定它所见范围内目标的位置。然而,视觉本身也是人类昀复杂的感知过程之一,视觉数据中通常含有大量的无关或者甚至使人误解的偏差,而其数据本身并不显示出相应的相关性和不相关性。所以,计算机视觉所要完成的是一系列复杂的信息处理任务[3]。计算机视觉是研究计算机模拟生物外显或宏观视觉功能的科学与技术,是一个相当新且发展十分迅速的研究领域。机器视觉在人类视觉无法感知的场合,如精确定量感知、危险场景感知、不可见物体感知等,更突显其优越性[4]。在工业领域,机器视觉已成功地用于零件的识别与定位、产品质量检验、刀具磨损监控、精密测量和移动机器人导航等领域[5-7]。随着计算机硬件和软件的飞速发展,高分辨率影像输入设备的研制及相匹配的高性能图像采集卡的出现,计算机视觉在各个领域的应用必将越来越广泛[8]。§1-2机器视觉的发展现状及应用1-2-1机器视觉的发展现状从机器视觉研究的主要内容来看,机器视觉系统又可以分为:输入设备、低层视觉、中层视觉、高层视觉和体系结构五个部分。输入设备(InputDevice)包括成像设备和数字化设备,如CCD摄像机、激光、红外、超声、X射线成像设备等。通过这些数字化设备,机器视觉系统可以获取数字化的图像信息。低层视觉(LowLevel)主要对输入的原始图像信号进行处理。这一过程借用了大量的图像处理技术和算法,如滤波、边缘检测、图像增强等,从图像中提取场景的基本特征。这一过程还包括图像校正、图像纹理检测、运动检测等。中层视觉的主要任务是恢复场景的深度、轮廓等有关场景的2.5维信息。高层视觉(HighLevel)的任务是以物体为中心的坐标系中,在原始输入图像、图像基本特征、2.5维图像的基础上恢复完整的三维图,建立物体的三维描述,识别三维物体并确定物体的位置和方向。体系结构涉及并行结构、分层结构、信息流结构、拓扑结构等[9]。机器视觉系统的基本结构如图1.1所示:在一定的光照(包括可见光、红外线甚至超声波等各种成像手段)条件下,成像设备(摄像机、图像采集卡等)把三维场景的图像采集到计算机内部,形成强度的二维阵列-原始图像;然后,运用图像处理技术对采集到的原始图像进行预处理以得到质量改善了的图像;其次
本文标题:基于机器视觉的标签动态检测识别
链接地址:https://www.777doc.com/doc-3412156 .html