您好,欢迎访问三七文档
概述由于有些场合,不能采用书写板等专用的输入设备输入文字,或文字信息已经是以手写体的形式存在,如果要利用计算机进行文字识别,就只能进行脱机手写体字符识别。OCR概念OCR技术是光学字符识别(OpticalCharacterRecognition)的缩写,是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。图像的输入原始文稿通过光电扫描仪或数码相机等输入设备转换成原始的二维图像信号,可以是彩色图像、灰度图像(grayscaleimage)或二值图像(binaryimage)。这个模块仅仅需要的是在获取图像过程中,尽可能的保证原始文稿的二维图像有比较好的质量,从而有利于后面识别模块的识别。预处理预处理是脱机手写识别系统中需要解决问题最多的一个模块。预处理通常包括以下几个过程:1、二值化2、消除干扰3、细化原图像二值化细化版面分析版面分析与理解是文字识别的前处理技术之一。它是利用图像处理、人工智能等技术完成文档图像文件中的文字域的分拣工作。其难度取决于版面的复杂程度,是文字识别系统提高实用化水平的主要技术指标之一。1、图像定位2、倾斜校正原图像校正后字符的分割1、行切割对于输入的二值化文字图像,首先要逐行地把各文字行图像切割出来,行切割的方法是:对二值化图像从上到下逐行扫描并同时计算每个扫描行的像素,以获取图像的水平投影,根据水平投影值确定文字行的位置,利用文字行间空白间隔造成的水平投影空白间隙,即可将各行文字分割出来2、字切割子切割是从行切割后得到的文字图像中将单个汉字的图像分割出来。基本方法是利用字与字之间的空白间隙在图像行垂直投影上形成的空白间隙将单个汉字的图像切割开来。汉字的构造决定了字切割是更为困难的文字归一化1.位置归一化为了消除汉字点阵位置上的偏差,需要把整个汉字点阵图形移动到规定的位置上,这个过程被称作为位置归一化两种方法:1、基于质心的位置归一化2、基于文字外边框的位置归一化2.大小归一化对不同大小的文字做变换,使之成为同一尺寸大小的文字,这个过程被称做大小归一化。通过大小归一化,许多特征就能够用于识别不同字号混排的文字。两种方法:1、将文字的外边框按比例线性放大或缩小成为规定尺寸的文字2、根据水平和垂直两个方向文字黑像素的分布进行大小归一化特征提取稳定特征的抽取是整个识别系统的核心之一,它决定了识别系统的性能。用于脱机手写字符识别的统计特征,根据特征抽取屈居的不同可粗略地分为全局统计特征和局部统计特征两大类。全局统计特征是将整个汉字点阵作为研究对象,从整体上抽取特征。局部统计特征是将字符点阵图像分割成不同区域或网络,在各个小区域内分别抽取统计特征识别识别也即分类器的设计,良好性能的分类器的设计也是整个识别系统的核心之一,它直接决定了识别系统的性能。识别的方法很多,多方案集成是近年来文字识别领域的一个主要研究方向,任何一种特征、任何一种识别方法都有其优点和局限性,借鉴印刷体字符识别的成功经验,走多特征融合、多方案集成的道路,是脱机手写字符识别系统走向实用化的有效途径。后处理文本识别后处理是指对单字识别的结果,利用词义、语义等上下文先验信息进行识别结果的确认或纠错。通常,在识别实际文本时,需要对单字识别的结果进行基于上下文关系的识别后处理。利用后处理技术,应该能够实现对单字识别结果的确认或纠错,并进一步区分相似字。脱机手写体字符识别系统结构待识别文档扫描仪或数码相机灰度图或二值图预处理预处理图像版面分析文字块图像行分割文字行图像字符分割单一字符图像识别单词后处理修正后的单词结果字符特征特征提取手写识别中存在的问题及困难由于手写变形的存在,使得手写体中相似字符的区分比印刷体要困难的多,因不同人书写风格的差异造成手写字符的变形很大,具体变现在以下几个方面:(1)基本笔画变化。横不平,竖不直,直笔变弯,折笔的拐角变成圆弧等。(2)笔画模糊,不规范,该连的不连,不该连的却相连。(3)笔画与笔画之间、部件与部件之间的位置发生变化。(4)笔画的倾斜角、笔画的长短、部件的大小发生变化。(5)对于脱机手写字符,不同人使用不同的书写笔可能造成笔画的粗细变化。参考文献[1]张宏林VisualC++数字图像模式识别技术及工程实践(第二版)人民邮电出版社2008.5[2]陈念一种基于复合特征的脱机手写体字符识别方法自然科学报2008.1[3]宋佳模式识别综述及汉字识别的原理科技广场2007.9[4]AhmedM.ElgammalAndMohamedA.Ismail.AGraph-BasedSegmentationandFeatureExtractionFrameworkforArabicTextRecognition[5].ManjunathAradhyaVN*,HemanthaKumarG,ShivakumaraPAnEfficientandRotationInvariant4-stepthinningAlgorithmforBinaryDocumentImages.ProceedingoftheInternationConferenceonInformationandAutomation,December15-18,2005
本文标题:脱机手写体字符识别
链接地址:https://www.777doc.com/doc-3495159 .html