您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 造纸印刷 > 印刷体汉字的特征提取
第10讲印刷体汉字的特征提取要点:印刷体汉字的归一化方法特征提取的重要性印刷体汉字的常用识别特征课堂练习印刷体汉字的归一化方法汉字被输入到计算机中提取特征前通常需要做归一化处理。归一化有三种:位置归一化大小归一化笔划粗细归一化返回位置归一化什么是位置归一化位置归一化的方法噪声对位置归一化的影响返回什么是位置归一化为了消除汉字点阵位置上的偏差,需要把整个汉字点阵图形移动到规定的位置上,这个过程被称做位置归一化。返回位置归一化的方法基于质心的位置归一化基于汉字外边框的位置归一化返回基于质心的位置归一化首先计算汉字的质心,然后再把质心移动到指定的位置上来。质心计算举例返回汉字质心的计算水平质心:垂直质心:IiJjIiJjxjicjiciG1111),(/),(IiJjIiJjyjicjicjG1111),(/),(设c(i,j)表示汉字点阵,质心计算如下:返回质心计算举例各行各列黑点数各行黑点数:I=161,1,12,2,2,8,1,1,1,14,1,1,1,1,2,1各列黑点数:J=160,2,3,3,3,4,5,10,4,4,3,2,3,3,1,0质心计算结果3.7),(/),(1111IiJjIiJjxjicjiciG16.8),(/),(1111IiJjIiJjyjicjicjG50),(11IiJjjic365),(11IiJjjici408),(11jicjIiJj返回基于汉字外边框的位置归一化首先计算汉字的外边框,并找出中心,然后把汉字中心移动到指定的位置上来。返回噪声对位置归一化的影响基于质心的位置归一化方法抗干扰力更强。返回大小归一化什么是大小归一化大小归一化的作用大小归一化的方法大小归一化的缺点返回什么是大小归一化对不同大小的文字做变换,使之成为同一尺寸大小的文字,这个过程被称做大小归一化。返回大小归一化的作用通过大小归一化,许多特征就能够用于识别不同字号混排的文字返回大小归一化的方法基于外框的大小归一化基于散度的大小归一化返回基于外框的大小归一化将汉字的外边框按比例线性放大或缩小成为规定尺寸的汉字。举例放大时需要考虑如何加点的问题缩小时需要考虑如何减点的问题不同的近似方法可能产生不同的结果返回基于外框的大小归一化举例返回放大时的加点问题放大加点LXLYlxlyyYxXlyLYlxLX,返回缩小时的减点问题缩小减点LXLYlylxYyXxLYlyLXlx,返回基于散度的大小归一化根据水平和垂直两个方向文字黑像素的分布进行大小归一化。水平散度x和垂直散度y的计算散度的计算举例基于散度的归一化举例返回水平散度和垂直散度的计算返回IiJjxIiJjxjicGijic112112),(/)()),((IiJjyJjIiyjicGjjic112112),(/)()),((散度计算举例x=3.869y=3.325返回0544.119700.1422yx基于散度的归一化举例返回大小归一化的缺点基于外框的大小归一化对噪声影响很敏感基于散度的大小归一化对于有些字,如“目”、“且”,归一化后会使它们的形状更相似而难以区别返回笔划粗细归一化什么是图像细化图像细化的作用图像细化的特点图像细化的方法图像细化举例返回什么是图像细化一个图像的“骨架”是指图像中央的骨骼部分,是描述图像几何及拓扑性质的重要特征之一。求一个图像骨架的过程通常称为对图像的“细化”过程。返回图像的骨架举例原图像图像骨架细化处理返回图像细化的作用在字符识别、地质构造识别、工业零件形状识别或图像理解中,先对被处理的图像进行细化有助于突出形状特点和减少冗余的信息量返回图像细化的特点在细化过程中,图像有规律的缩小在缩小过程中,图像的连通性质保持不变返回图像细化的方法把一幅图像中的一个3×3区域,对各点标记名称P1,P2,…,P9,其中P1位于中心。如果P1=1(即黑点),在下面四个条件同时满足时,删除P1(即使P1=0)。返回3×3区域的各点标记返回P3P2P9P4P1P8P5P6P7图像细化的四个条件2NZ(P1)6,NZ(P1)=P2+P3+…+P9Z0(P1)=1,Z0(P1)=P2*P3+…+P8*P9+P9*P2P2*P4*P8=0或者Z0(P2)1P2*P4*P6=0或者Z0(P4)1返回图像细化举例返回特征提取的重要性印刷体汉字识别中的关键问题是特征提取问题,尤其是提取那些比较具有分类价值,同时又比较容易通过程序计算得到的那些特征,以及那些对字体的不同、汉字大小的不同和噪声的影响等因素不敏感的特征。返回印刷体汉字的常用识别特征复杂指数,四边码,粗外围特征粗网格特征,笔划密度特征汉字特征点,包含配选法基于小笔段的层次结构,差笔划返回复杂指数字符在x和y方向的复杂指数定义为:复杂指数反映了字符的x和y方向笔划的复杂程度,对字符的位置和大小不敏感。复杂指数举例返回yJjIiyxIiJjxjiccjicc1111),(,),(复杂指数举例x=3.869y=3.325cx=12.92cy=15.04返回四边码从字符周围边框开始,向内取适当的宽度,以此宽度分割出四周的四个部分。根据每一个部分中含有的文字黑像素的多少分为四级编码(0,1,2,3)。四边码特征对字符的断线适应性较强。四边码举例返回四边码举例下图中“昨”字的四边码为“0102”。返回粗外围特征粗外围特征的提取方法粗外围特征举例粗外围特征的作用返回粗外围特征的提取方法先求出文字的外边框,再把p×q点阵文字分割成n×n份,n通常取8。从文字四边框各向对边扫描,计算最初与文字笔划相碰的非文字部分的面积和全部面积之比作为一次粗外围特征p1i(4n维),再将第二次与文字线相碰的非文字部分面积和全部文字面积之比作为二次粗外围特征p2i(4n维),形成8n维的特征向量。返回粗外围特征举例返回粗外围特征的作用一次粗外围特征反映了文字轮廓特征,二次粗外围特征在某种程度上反映了文字内部结构。返回粗网格特征把加框p×q点阵文字分割成n×n份,n通常取8,取每份中黑像素对整个文字黑像素的比例,将所有n×n值排成一列形成维特征向量粗网格特征体现了文字整体形状的分布,但该特征抗笔划位置干扰的能力差返回2n笔划密度特征笔划密度特征的提取方法笔划密度特征举例笔划密度特征的作用返回笔划密度特征的提取方法在加框的p×q点阵中,向不同的方向投影,对文字黑像素的个数做累加计算,形成笔划密度直方图。通常取水平、垂直、45度和135度四个扫描方向,每个方向取n个值(通常n=16)作为特征,形成4n维特征向量。返回笔划密度特征举例返回笔划密度特征的作用这种从文字四个方向抽取的笔划密度特征叫做四方向笔划密度特征,它不但对印刷体汉字分类有较好的效果,对手写印刷体汉字分类也具有价值。返回汉字特征点什么是汉字特征点汉字笔划骨架和特征点的关系汉字特征点的分类汉字特征点举例汉字特征点的作用汉字特征点的稳定性返回什么是汉字特征点一个汉字的笔划上和背景中的关键点是汉字结构的一种本质字形特征。汉字基本上由直线笔划构成,是一种直线型文字。在一幅二值化图像中,汉字信息绝大部分集中在汉字骨架上,而汉字骨架信息又大多集中在若干笔划特征点上。这些点称为笔划特征点。返回汉字笔划骨架和特征点的关系确定笔划特征点后,根据若干连接规则,汉字的笔划骨架就可以确定。返回汉字特征点的分类汉字笔划特征点可以取端点、折点、歧点和交点。端点是笔划的起(或终)点且不与别的笔划相接;折点是笔划方向出现显著变化的点;歧点是三叉点,要求其中两个笔段分支方向相同;交点是四叉点且有两对等的对顶角。返回汉字特征点举例返回汉字特征点的作用汉字笔划特征点集中了主要的汉字结构信息。端、折点决定了一个汉字的笔划位置和形状;歧点、交点决定了不同笔划间的相互连接关系。汉字特征点反映了汉字结构特征.所以,用特征点来识别汉字,可以增加抗噪声能力,提高实用性。返回汉字特征点的稳定性由于汉字特征点是由汉字结构本质所决定的,所以无论是北方印刷汉字还是南方印刷汉字;无论是书版还是报版字,无论是宋体印刷汉字还是其他体印刷汉字,甚至是书写规整的手写印刷体汉字,同一汉字的特征点很少变动。其中折点、交点更稳定。返回包含配选法什么是包含配选法包含配选法的原理图包含配选法的特点使用包含配选法应注意的问题返回什么是包含配选法许多汉字具有相同的偏旁部首,包含配选法就是利用这一点对汉字分类。分类用的模板是汉字偏旁部首的骨架图形。分类时,将输入文字和各标准模板做“与”运算。根据未知输入文字图像和分类用标准模板图像“与”的结果是否相同于该标准图像,可以判断出未知文字属于哪一类。返回包含配选法的原理图包含配选法实际上是一种模板匹配法。返回包含配选法的特点当识别字数增多时,由于偏旁部首的标准模板增加很少,其分类速度比粗外围和粗网格法容易提高,而存储量要求较少。返回使用包含配选法应注意的问题在没有和标准图像相“与”匹配前,先把未知文字图像横线加粗成大于等于3个像素宽,以利于包含相匹配的模板,但是也加大了包含其他标准模板的概率,因而误识率会增加。为避免文字笔划绝对位置移动带来的干扰,需要把图像沿上下左右四个方向平移一个像素,然后分别与标准模板相匹配。只要有一次匹配成功,就判定该文字属于标准模板图像的类别。返回基于小笔段的层次结构什么是小笔段小笔段举例小笔段的作用小笔段的优点小笔段的缺点返回什么是小笔段小笔段是组成汉字笔划的基元汉字笔划由若干小笔段首尾相连构成返回小笔段举例返回小笔段的作用小笔段组成了笔划,笔划又组成了汉字。由小笔段到笔划,再到汉字的层次结构描述,反映了汉字结构不同层次的约束关系。返回小笔段的优点小笔段作为基元一方面易于提取;另一方面它又保留了汉字基本的笔划结构信息,且在字体变化或噪声干扰条件下,仍能保持笔划结构的绝大部分信息。返回小笔段的缺点汉字字体改变和干扰影响会使得小笔段特征向量有变化。因此,用层次结构法对未知汉字匹配判别时,采用精确匹配方法往往不能奏效。较好的办法是采用由汉字小笔段相关系数(相关系数反映了相互约束关系)约束的松弛匹配算法。返回差笔划差笔划法是一种适用于多体印刷汉字细分的方法。举例粗分类后,通常每类中含有许多形状相似的文字,采用差笔划方法,可以较好地区分这些形状相似的文字。返回差笔划法举例返回课堂练习计算右边字符矩阵的质心计算右边字符矩阵的水平和垂直投影密度向量判断第2行第2列的1是否满足图像细化的删除条件返回计算质心质心的计算过程如下:返回72.543/24643/)610594847464534434251(43/))),(((),(/),(101811111ijIiJjIiJjxjicijicjiciG43),(11IiJjjic44.443/19143/)18971063534438251(43/))),(((),(/),(811011111jiIiJjIiJjyjicjjicjicjG计算水平投影密度向量水平投影向量为:(5,4,4,3,4,4,4,4,5,6)水平投影密度向量为:(5,4,4,3,4,4,4,4,5,6)/43返回计算垂直投影密度向量垂直投影向量为:(5,8,4,3,3,10,9,1)垂直投影密度向量为:(5,8,4,3,3,10,9,1)/43返回
本文标题:印刷体汉字的特征提取
链接地址:https://www.777doc.com/doc-56873 .html