您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 汉王数字化档案馆解决方案
汉王数字化档案馆解决方案第一部分背景概述档案是过去和现在的国家机构、社会组织以及个人从事政治、军事、经济、科学、技术、文化、宗教等活动直接形成的对国家和社会有保存价值的各种文字、图表、声像等不同形式的历史记录。与传统载体、原子形式的档案相比,数字化形式的档案的最大特点是能够通过网络迅速流动。数字档案馆的研究和建设将彻底改变档案的利用方式,冲破档案利用的种种局限,使档案馆从封闭走向开放,为政府决策、企业经营服务,做到“科技服务档案,档案服务经济”。数字档案馆是具有管理数字化档案能力的一个系统,是综合性档案馆的组成部分,它能够全方位、全过程地对数字档案进行管理,并能够为所属地区立档单位提供数字档案管理服务。数字档案馆包括行政组织、管理规范和支撑其运作的计算机网络应用系统。通过数字档案馆,档案信息价值可以得到充分体现。数字档案馆的建设将促使综合性档案馆从档案的保管和利用职能向信息采集、管理和信息服务方面职能转变。数字档案馆是档案从库存资料向信息资源转换的中间站,也是档案信息化、产业化的支撑平台。数字化档案馆主要是强调馆藏的数字化,将数字化的档案信息上网提供利用,是建设数字档案馆的的基础,是建设数字档案馆必不可少的前期准备工作,是构成数字档案馆的一部分。国家十五计划已对数字化档案馆的建设提出了明确要求和具体实施步骤,这标志着中国数字化档案馆建设工程已进入具体实施阶段,这是一项充满创新和挑战的工程,需要社会各界广泛参与,从而使中国档案管理现代化的步伐跟上世界发展的脚步。在国家档案局档案科学研究所的指导下,汉王科技与汉王公司联合推出包括数字档案资源建设、数字档案管理利用两个重要环节的数字化档案馆应用方案。第二部分数字档案资源建设一、“汉王OCR录入工厂系统(网络版)”加工方案:信息资源对于网络时代,正如蒸汽机于工业社会,我们致力于信息资源建设,正是在构建未来社会的基石。要丰富网络资源,提高原有信息知识的利用效率,对图书、文献、档案等信息资料的数字化就显得尤其重要。但如何将种类繁多的文档资料、行业信息进行自动化处理,以满足各种数字化信息的应用,这就是OCR技术(光学字符识别)在信息数字化建设中起到的至关重要的作用。1、总体功能:实现大量原始资料的快速扫描录入与保存;OCR录入、校对、整理;数据库存储、备份、检索和管理;对各工序环节能进行监督和调度协调;员工岗位的管理;质量控制;系统管理。2、系统特点:1)大量原始资料的快速扫描录入与保存各种版式的现代书籍:横版、竖版、简体、繁体;古籍:特别是珍本、善本;各年代的报刊杂志及内部资料;各年代公文档案;各种报表或票据。2)汉字识别之王:国际领先的OCR录入、校对、整理功能采用汉王先进的OCR识别技术,识别率高、速度快;快捷精确的横校、纵校、对比校对;支持多种电子文档存储格式:PDF、HTML、RTF、TXT、XLS,方便地实现全文检索,并将逐步与国际标准电子文档格式接轨。3)完善的员工管理功能综合了考勤管理、岗位管理、工资管理三大功能,系统自动记录员工出勤情况,自动为各岗位分配工作并记录分配情况及工作量,并根据以上记录情况生成员工工资明细表;提供轻松友好的工作界面。4)自动进行各工序环节的监督和调度协调服务器给各岗位分配任务,并进行任务协调,使各客户端的任务既相互独立又形成完整的生产流程,提高工作效率,使得文字处理速度可达到每人班10-12万字,比手工录入的效率提高5-8倍。系统自动进行员工工作量计算、差错量监控,可将整体差错量控制在万分之二以内,从而达到了出版质量要求。5)对本套系统的监控、管理及日常维护,并定期生成安全日志二、系统结构:1、系统网络结构图:2、网络拓扑结构:三、系统功能描述:汉王OCR海量录入软件系统具备四大功能:文字自动录入、流水线管理、质量控制和员工管理、系统管理。1)文字自动录入功能OCR海量录入系统采用汉王在OCR领域领先的成熟的文字自动录入技术,可实现自动图像预处理、版面分析,能识别中文简体、繁体、英文及混排,多字体多字号文档。2)流水线管理功能OCR海量书籍录入系统的操作分为几个步骤:纸质资料的整理、扫描、图像预处理、版面分析、识别、校对和保存。单机OCR系统要求操作员熟悉每个步骤:扫描、图像预处理、版面分析、识别、校对和保存,这种串行的工作方式会降低效率,对操作员技能要求也较高。但是,如果将冗长、复杂的生产过程合理地划分成若干道工序,每道工序操作简便,合理安排工作岗位,并行操作,生产效率和质量就能得到很大的提高。OCR海量录入系统就是采用生产流水线管理方式,根据OCR技术和操作的特点,将生产过程划分成以下几道工序:四、工序说明:1、图书资料整理:为了便于扫描和以后的查询、检索而进行的图书分类、拆装、命名、编号等。2、扫描:扫描是纸质文稿图像输入计算机的过程。一般把相关文稿顺序扫描,在扫描质量控制程序自动检测并修正后,自动保存到数据库中。3、图像处理:为了提高识别率,对图像进行“消蓝去污”的处理,即去掉图像上影响识别率的噪音如麻点、下划线等,图像质量控制程序自动监测图像处理质量。4、版面分析:能自动进行版面理解并定位,判别划框区域是横排文本区、竖排文本区、表格区还是图像区,并对不同属性的区域以不同颜色的线框标识出来。自动版面分析在后台运行,操作人员可在前台进行确认,必要时对自动版面分析结果加入手工干预。5、识别:把文字图像转化为计算机文字内码,可以识别印刷体和手写体中文(包括简体字和繁体字)、表格、中英文混排,识别出来的文字内码可以是GB码、BIG5码、GBK码或者Unicode码。识别过程在后台运行。6、纵向校对:具有很强的查错、纠错能力。纵向校对是将一个图像或若干个图像中识别成同一个字的文字图像列在一起显示,并以突出颜色标出可疑字,便于操作员发现错误和修改。7、横向校对:这是传统的人工校对方法,操作员直接对比识别结果文本和图像,以发现识别错误文字。系统自动调出文字对应的图像,进行比对。同时,以醒目的颜色标出识别可信度不高的文字。8、版面还原:将识别并修改好的文本还原成跟扫描文稿版面的布局一样、可以供计算机阅读和查询检索的RTF、PDF、HTML、SGML/XML格式的数字文档。9、数据入库:版面还原数字文档的保存。10、质量控制和员工管理:质量控制是为了保证和控制系统的录入质量而采取的一整套方法与措施。主要是在各工序中加入对员工工作完成情况及差错量的监控和工作量的计算,以求将整体差错量控制在万分之五以内。员工的工作态度将会直接影响到数据录入的质量和工作效率,要使员工保持一种积极的工作态度,必须有好的管理制度和客观的评价标准及依据。OCR海量录入系统还可以详尽地提供员工考勤情况和工作质量数据,对员工的工作情况给予公正的评估。员工管理系统在整个系统中处于支配地位。该部分由考勤管理、工资管理、质量控制、工作分配、返工单管理和建立用户等几个模块组成。11、考勤管理:记录各员工的出勤、缺勤状况。12、岗位管理:记录各岗位的工作分配及员工的工作量、差错量(质、数量的差错要求控制在万分之五以内)的状况。13、系统管理功能“OCR海量录入软件系统”是一个大型的Intranet网络系统,它包含成千上万的加工数据资料和员工详尽的工作信息。管理人员通过简明友好的系统管理界面可以方便地查询数据、备份数据和系统维护。OCR海量录入系统还提供安全日志,供管理人员查询。五、系统逻辑模型:说明:整个系统围绕两个互相联系的数据库:员工管理数据库、OCR扫描文件数据库展开工作。员工管理数据库由员工信息表、工种信息表、员工考勤表、员工工作量表、班次表、工资管理表等构成一个完整的员工资料库。员工依流程指定的步骤登录、考勤、申请工作、执行操作并接受管理监督。OCR录入资料数据库经由扫描录入、图像处理、版面分析、识别、纵校、横校、版面还原等工序处理最终形成。其中在信息传输上采取申请任务方式与分配任务方式相结合使用:1、申请任务方式:用户完成一件工作包的同时查看是否有已经分配的工作包,如没有,则申请另一个工作包。2、分配任务方式:由管理员分配工作包给每一个员工。为对此流程进行有效管理,我们建立了原始工作包表、工序跟踪表、返工单表、员工工作分配表、工作包表等。第三部分数字档案的管理利用此部分采用汉王公司在国家档案局科研所指导下,根据档案管理国家标准(GB)和行业标准(DA),在对档案管理业务充分理解的情况的基础上,全面考虑各地区、各行业档案管理不同需求而研发出的新一代档案管理软件---汉王3.0版。它具有专业性、易用性和可扩展性三大特性。一、系统功能:通过对各地、各行业多个机关企事业单位的分析,根据其档案管理特点,系统设计了以下功能:文件、档案种类自定义,著录标引,文件管理,自动组卷、检索查询,利用管理,报表设计、原文管理、权限控制等。1、著录标引对各类文件、档案进行著录登记。2、快捷录入选择录入、代码录入方式。3、人性化设计,自定义著录界面用户按照习惯任意定义录入界面,增强程序亲和力。4、自动纠错对用户错误的输入、误输入自动提示纠正。5、自动标引自动生成主题词。6、任意导入历史数据7、原文管理文字、图像、多媒体等各种格式电子文件以及纸质文件材料直接扫描存储管理。原文数据的加密、压缩。文件、档案以及各种原文数据可以存储至磁带机、光盘塔。8、整理编目自动组卷:遵循国家标准,同时支持传统与简化两种组卷方式进行自动组卷;另外允许用户自定义组卷条件,对各种专门类型档案进行自动组卷;自动生成档案管理所需案卷号、件号、起止号等各种序号;档案整理:数据采集功能可以直接导入其他档案管理系统的历史数据;针对自动组卷或已经组好的案卷,可以采用可视化方式进行案卷的分拆、合并、剔除、排序等调整;提供档案校验功能,对已有的案卷号、件号等各种档案管理序号可以自主修改和重新排序,对重号、错号自动校验;面对各大部委,部门组卷,档案处监督的情况,以后组卷不再是到下一年年初组上一年度的情况,而是随时可能组卷,随时提交给档案处,档案处在接收这些案卷的时候,可以对档案组卷情况进行检查,如果组卷符合要求,就接收;如果不符合要求,就提醒相应部门重新组卷,并指明问题所在。9、打印编目:自动生成符合档案工作相关标准的案卷目录、卷内目录、案卷封面以及备考表等;提供多种地区、行业报表模版,报表格式可以任意定义扩充。超强报表设计器,可以快捷制作专业报表。10、检索统计:单条件简易查找——逐条查询、批量筛选,方便快捷。多条件组合检索——复合模糊条件,高速检索响应。根据用户需求进行全文检索、图文声像一体化检索。对检索结果进行排序、打印、格式转换、远程传递等处理。登记借阅利用情况,超期自动催还,统计借阅情况,打印借阅登记单。借阅利用情况和文件档案记录“自动互查”。11、档案统计可根据档案统计年报中的各种统计报表制作模板.可灵活定义一些统计报表。12、系统维护用户管理:用户分级权限控制,确保信息万无一失。实体分类:无限扩展空间,管理百种档案。制作目录:报表随意制作,满足特定行业需求。二、系统特点:系统采用VB6.0作为主要开发环境,对不同的用户可选用ACCESS或SOL做数据库,并且自行选择单机运行或联网运行。1、功能强大专业性强系统涵盖了文书处理和档案管理全过程,集文件登记、公文处理、自动组卷、自动编目、智能检索、统计编研、档案保护等功能于一体。系统采取“一次登记,无限次使用”管理模式,用户只需要录入文件或档案基本信息,由程序来自动完成处理、传阅、查询、组卷、打印乃至销毁等档案室基本业务工作。用户可根据需要自由设计表格,既能套打,也能全表输出;系统的多种条件和智能模糊检索功能,查准率达100%,查全率达99%以上。2、系统分级的安全策略通过严格的分级权限机制,系统管理员可以对各个用户设置相应的用户权限及登录口令。并对数据进行加密处理,确保了数据的安全性。系统数据库经过加密处理,防止未授权打开,确保了系统的安全性。1)原文数据经过加密、压缩后存入数据库,防止了误删除、误修改、泄密等问题,确保了数据的安全性。2)系统有详细的权限设置功能,可定义从系统管理
本文标题:汉王数字化档案馆解决方案
链接地址:https://www.777doc.com/doc-2368538 .html