您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > 计算机科学-投稿模板
到期日期:2008-02-02本文受863国家重点基金项目(2007080504),国家自然科学基金(0002014014)资助。杨有(1970-),男,讲师,主要研究方向为图像处理等,Email:yangyou@121.com;张小小(1980-),女,硕士生,主要研究方向为图像处理等;王伟(1980-),男,硕士生,主要研究为图像处理等。一种基于模板的档案图像压缩新方法杨有1,2张小小2王伟2,3(重庆师范大学数学与计算机科学学院重庆400047)1(重庆大学计算机科学与工程学院,重庆400044)2(重庆教育学院计算机与现代教育技术系,重庆400067)3摘要在大容量档案图像数据库中,不仅单页档案图像内部存在数据冗余,而且档案图像页之间存在大量集合冗余。本文提出了基于模板的压缩新方法,通过定义相似图像集合的模板,充分利用图像数据的先验知识,对档案图像的内容进行分析和理解,从图像内和图像间以二维模式压缩图像数据。实验表明,该方法能够大幅提高压缩性能。关键词档案图像,模板,图像压缩,集合冗余中图法分类号:TPXXX文献标识码:ANewCompressionApproachtoDocumentImageBasedonTemplateYANGYou1,2ZHANGXiao-xiao2WANGWei2,3(SchoolofMathematicsandComputerScience,ChongqingNormalUniversity,Chongqing400047,China)1(DepartmentofComputerScienceandEngineering,ChongqingUniversity,Chongqing400044,China)2(DepartmentofComputerandModernEducationTechnology,ChongqingEducationCollege,Chongqing,400067,China)3AbstractInsuperlargedocumentimagedatabase,dataredundancyexistsnotonlyinindividualimage,butalsobetweenimages.Anewcompressionapproachbasedontemplatewasproposed.Throughthedefinitionoftemplate,theapproachutilizedtheimagepropheticknowledgesufficiently.Aftertheanalysisandunderstandingofimagecontent,itcompressedimagefromintra-imageandinter-image.Theexperimentshowedthattheapproachcouldincreasecompressionratiogreatly.KeywordsDocumentimage,Template,Imagecompression,Setredundancy档案数码化是信息化建设的一项基础工作,而信息化又是覆盖我国现代化建设全局的一项战略举措。基于网络的数字档案图像应用系统必须考虑三个问题:一是从存储空间方面考虑,即档案的大小。一页ASCII码档案只占2~3KB,而一页典型扫描的数字档案需要500kB~2MB,由此可见数字档案压缩的重要性。二是从时间方面考虑,即压缩图像的有效存取。传统压缩减少了存储容量,但没有提供压缩数据的有效存取方法,比如快速传输、压缩域处理和存取等。三是数字档案的可读性,即档案的质量。因此,在遵照《中华人民共和国档案法》和一些相应行规的前提下,对数字档案图像进行压缩就成为这类应用系统的核心问题。1档案图像压缩技术档案图像属于静态图像,但它又与诸如遥感和医学等静态图像有所区别,其压缩方法也具有一定的特殊性。在众多的档案图像定义中,公认的观念是:档案图像是具有结构的图像,它包含了许多表征语言符号的元素,且这些元素之间具有明显的冗余性。由此,我们知道,在档案图像中,大多数有用信息在符号级,而不是在像素级或纹理级中,因此纯粹的基于像素级或亚像素级的静态图像编码方法对档案图像是不适用的。同时,由于档案图像具有高对比度、高倾斜度、局部非均匀像素模式等特点,对其采用纹理编码也是不合适的。对于文本富裕档案,由于符号多次重复出现,而且图像具有较高程度的层次结构,所以这类档案的压缩可以采取去除符号级冗余的压缩方法,即PM&S(PatternMatchingandSubstitute,模式匹配与替代)技术[1,2]。在数字档案图像应用系统中,数据压缩不仅要考虑单幅档案图像的编码,而且还要考虑档案图像之间的冗余性,即用图像的集合统计特性来代替单个图像统计特性,从而降低整个图像集合的熵。比如,在工商档案、国土资源档案等政府资源类数字档案应用系统当中,一些申请书和登记表的内容都具有相似性,各户对应档案页之间存在极大的信息冗余。以某市的工商企业登记档案系统为例,该市共有约20万户企业,每户企业都有相似的档案页,如公司法定代表人履历表、公司章程等。由此可以看出,在这类应用系统当中,去除这类图像间的特定冗余性是十分必要的。为消除图像间的这类冗余,降低整个图像集合的熵,K.Karadimitriou等人针对医学图像数据,定义了相似图像(similarimage)和集合冗余(setredundancy)的概念,首先提出了提取集合冗余的两种方法:MMD方法(Min-MaxDifferential,最小-最大差分法)和MMP方法(Min-MaxPredictive,最小-最大预测法)[3],随后又提出了提取集合冗余的质心方法(CentroidMethod)[4]。这三种方法以及后来的改进方法――HCM(HybridCompressionModel,混合压缩模型)[5]统称为SRC(SetRedundancyCompression,集合冗余压缩)技术,它们利用图像间的像素统计特性,降低整个图像集合的熵。而且随着图像间的相似性增加,集合的熵就降低得越多。在数字档案应用系统中,由于档案图像本身具有高度结构性,相似档案图像可以划分为两类区域,一类区域的信息是固定不变的,即从区域的角度出发就可确定该部分为冗余信息,而不去考虑该区域内的像素相似性;另一类区域的信息具有变化性,它是各户档案图像页之间的真正区别,需要单独进行压缩处理。比如,在图1的示例中,人工填写的信息、照片、身份证、印章和签字属于信息变化区域,我们定义为ROI区域,需要根据这些区域的性质(图像、图形、文字)分别采取不同的压缩策略;而图像剩余的区域则属于信息非变化区域,我们定义为非ROI区域,记为RROI,它是图像的相似区域,可以借鉴SRC的思想消除图像之间的冗余。此即本文提出的基于模板压缩的基本思想,我们简称为COT(CompressionBasedonTemplate)方法。((((((((((((((((((((((((((((((((((((((((((((((((2(((((((((((((1图1相似图像I2COT的基本思想2.1模板及其性质COT方法首先需要创建档案模板,一个模板对应一组图像,即一个相似图像集合,在该集合中,所有的图像具有某种程度的相似性,比如图像的相同区域具有类似的像素亮度,图像的直方图具有可比性,图像具有相似的边缘分布和特征分布等。在数字档案生产过程中,可以由文件名的前缀或后缀人工标识相似图像,不同的相似图像构成不同的相似图像集合,对应着不同的模板。图2为图1所示图像对应的模板,其中共有8个ROI区域,即相似图像集合的变化部分,余下区域则为非ROI区域,对应图像集合的相似部分。由于模板和图像集合之间存在一一对应关系,因此可以通过定义模板的性质来表达各相似图像的本质特征。为此,我们定义:1)1TA:模板的性质1,表示ROI区域在模板图像中的相对位置。如果ROI区域为圆形(比如印章),则1TA等于该区域的中心坐标;如果ROI区域为矩形,则1TA等于该矩形的左上角坐标。(((((((((((((((((((((((((((((((((((((((((((图2模板及其ROI区域2)2TA:模板的性质2,表示ROI区域的大小。如果ROI区域为圆形,则2TA等于该圆的半径;如果ROI区域为矩形,则2TA等于该矩形的宽度和高度。该性质与1TA配合,可以指明相似图像中对应目标所处的大致区域,为区域分割缩小范围,降低计算量。3)3TA:模板的性质3,表示ROI区域的类型,其值域为{IZ(图像区域)、GZ(图形区域)、TZ(文字区域)}。该性质用于选择区域编码方法。4)4TA:模板的性质4,用于图像配准。它具有两层含义,一是表达基图像的特征信息;二是指明提取浮动图像特征集的方法,包括特征类型和特征的参考坐标。2.2集合冗余压缩考虑某个模板T,设其相似图像集合的相似性为S,则变化性定义为1VS。比如,如果0.6S,则平均来讲,对于每个像素位置,集合中有60%的图像在该位置具有相同的像素值,而余下的40%则具有变化性。又假设存在n+1种符号的字母表01,,,naaa,且ka是具有最高频率S的符号,即kPaS,1kn,则各种符号出现的概率之和为:11njjjjkPaSPa根据Shannon熵的定义,我们可以得到该相似图像集合的熵TH为:loglogTjjjkHSSPaPa(1)如果除字母ka以外其它字母出现的概率相等,即jPaVn,jk则(1)式可进一步简化为:loglog/THSSVVn(2)式子(1)和(2)说明:随着集合相似性S的增加,模板T对应的相似图像集合的熵H会明显减少。从而,在档案图像数据库应用系统中,所有模板对应的图像集合的熵TTHH也会降低。3COT压缩方法COT压缩方法主要包括图像配准、图像分割和图像压缩三个步骤,如图3所示。以相似图像集中的某幅图像S为浮动图像,以模板T为基图像首先进行图像配准,得到配准后的灰度图像R;R在模板的控制作用下,快速进行图像分割,得到相似区域RROI和非相似区域ROI,ROI又分为IZ、GZ和TZ三个类型,然后根据类型分别采取不同的区域编码策略。3.1图像配准图像配准是指同一目标的两幅或两幅以上图像在空间位置上的对准。由于可以将模板视为相似图像集合中的标准图像,因此将模板作为基图像,将所有的相似图像作为浮动图像并与模板图像配准是合理的。配准过程实现了两个目的:一是解决了相似图像的倾斜问题,更有利于图像内的冗余去除[7];二是使得该模板对应的集合冗余达到最大,有利于降低图像集合的熵。((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((UDP(UDP(((((((((((((((((((((((((((((((((((((((((((((((((((((图3基于模板的图像压缩过程由于基于灰度相关的图像配准能够获得较高的定位精度,但其计算量大,难以达到实时性要求,而且一旦进入信息贫乏的区域,便会导致误配准率的上升,因此基于特征的配准方法成为一种可选方案。该方案首先从相似图像中提取特征,用相似性度量和一些约束条件确定几何变换,最后将该变换作用于相似图像。配准中可以采用的特征包括边缘、轮廓、直线、兴趣点、颜色、纹理等。在COT压缩方法中,模板T创建之时就定义了模板图像的特征集合,即4TA,它是已知的、无需计算;由于相似图像I和模板T具有相似性,因此根据4TA的位置信息,可以在较小的图像区域内抽取相似图像I的特征,快速实现图像配准。3.1.1图像分割图像分割是为后续工作有效进行而将图像划分为若干有意义区域的一种技术,它将图像细分为构成它的子区域或对象,分割的程度取决于要解决的问题,也就是说,在应用中,当感兴趣的对象已经被分离出来时,就
本文标题:计算机科学-投稿模板
链接地址:https://www.777doc.com/doc-6638449 .html