您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > ocr文字识别软件技术在档案管理中的运用
ocr文字识别软件技术在档案管理中的运用随着信息化社会的不断发展,计算机网络技术的不断普及,档案利用人群对档案信息的检索准确率、查全率的要求越来越高,而传统的案卷级和文件级目录检索技术已经无法适应当前网络时代的搜索要求,在网络中“人肉搜索”“人立方”越来越受到民众的关注和追捧,网络搜索的越来越细化和精致,迫使档案检索对象及其技术的发展,所以档案全文数字化是档案管理发展的必然趋势。这给档案的输入人员将带来巨大的挑战,这是一项巨大的工作项目,如针对一卷50页的案卷,案卷和卷内目录一般不超过51个,而全部目录在数据库著录时,对于熟悉计算机输入的人来讲不费吹灰之力,几分钟或更长点时间就可以完成,但是如需做到全文任何关键词检索,必须把每个页面上的汉字字符(可能超过500个)输入计算机数据库,50页的文件可能有汉字字符25000个左右,以1分钟输入100中文字符计算,连续不断地输入也需要4个多小时。所以面对浩瀚如海的馆藏档案案卷以及每日俱增的新归档案卷,依赖单个字符的输入法和数量相对较少的档案工作人员是无法完成如此巨大的全文输入工作量。在档案管理工作中馆藏量和增量档案一般很难缩小和控制,工作人员数量很难大幅度增加,所以唯有改变数据的输入方式,提高输入效率。捷速ocr文字识别正是弥补了单字符输入速度慢的不足,OCR识别率的大幅提高更是填补单字符输入差错率高的缺陷。因此从当前档案全文数字的工作量以及计算机输入和各种文字识别技术的功效来判定,捷速ocr文字识别是比较适应档案全文数字化的一种技术,是实现档案全文数字化的技术基础和实现途径之一。随着捷速ocr文字识别的不断完善,OCR的识别正确率趋向完美以及办公自动化的推广,档案检索技术得以突破目录检索的瓶颈,可以实现全文任何字符的检索。这是自计算机数据库技术、网络技术以及存储技术运用于档案管理后又一个里程碑式的发展,使档案信息检索技术实现了跨越式的发展,从更本上解决了档案用户面对浩瀚档案目录无所适从、束手无策的局面。
本文标题:ocr文字识别软件技术在档案管理中的运用
链接地址:https://www.777doc.com/doc-2884411 .html