您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 电子文件长期保存格式探析
浅谈电子文件的长期保存和利用彭净(广州市机关信息网络中心广东广州510635)摘要:随着现行文件越来越多地以电子文件的形式产生,电子文件的管理难题摆在了人们面前。怎样长期保留有价值电子文件、如何确保电子文件在整个生命周期内的质量完整?尤其是当产生电子文件的软硬件环境不复存在的情况下,如何确保未来的用户仍能查阅这些电子文件?一直是国内外档案界研究和探讨的热门话题。本文以我国对此问题的主要研究为基础,并以国外解决此问题的一些方法为参考,分析、介绍解决电子文件长期保存和利用的一些对策。关键词:电子文件;保存;利用1.电子文件长期保存和利用存在的问题1.1多样性。不同背景和作用生成的电子文件,在收集、保管和利用方面与纸质文件的收集、保管和利用大不相同;不同信息类型的电子文件,由于技术特性不同,存储载体和记录信息的标准、压缩方式也大相径庭。所以,由多种机读格式产生的电子文件,在保证其真实性、完整性、可靠性方面的技术难题很多,而能有效解决这些难题的方法却很少。1.2复杂性。电子文件如果只限于单纯的文字处理,因其技术含量较低,标准化程度还是比较高的。随着多媒体技术的发展,电子文件成了复杂的多信息混合物。一是在文本处理上可以签署图形属性的手迹批示,甚至声音批示,使得同一份文件的不同信息存放在不同的数据库中;二是信息技术更新太快,使电子文件离开了特定环境就失去可读性;三是电子文件有易复制、修改、删除的特点,还可根据所需变换输出字体、字号,既使档案“原件”的概念变得难以确认,又使传统的字迹鉴定技术无法分辨其原始性;四是为适应计算机硬、软件技术不断更新换代,需对电子文件不断变换鉴定载体和鉴定格式。1.3耐久性。在信息技术高速发展的过程中,软硬件、数据格式、网络模式的生命周期相对较短。物理介质的保存方式也无法满足长期保存的要求,尤其是当保存方案本身属于落伍时,不但解决不了问题,反而使问题更加复杂化。1.4变化性。随着各种格式的增加,数据的类型也变得越来越复杂(不仅包括网络和相关数据库,还包括OA文件、地理信息文件和网页等)。电子文件因制作方便而产生比以往更多的文件,加上用户总是根据自身需要不断地修改和补充,使得保管期限很难划定。电子文件对背景信息和元数据具有很强的依赖性,如果背景信息与内容信息分离保存,一旦失去背景信息,文件的内容即便仍有意义也不具有凭证价值。元数据也因其隐含性容易被忽视,一旦元数据丢失或破坏,电子文件的原始性就会改变。1.5规模性。随着电子文件无限制的增长,档案工作者的工作负担会远远超出自身的技术能力。随着电子政务、电子商务的快速发展,信息数据的增长规模将越来越庞大。2.电子文件长期保存和利用的对策2.1档案部门提前介入电子文件的运行和管理。一些国家将档案管理延伸到文件管理中。如加拿大的《文件保管期限表》,提出“电子文件从生成时起就建立档案管理”的要求,并通过编制通用软件包,实现电子文件与纸质文件的统一管理。据报道,美国通用公司将“微型全息存储”应用到日常消费中。这项全息存储技术的原理是:通过三维模式在一张标准DVD光盘上最大限度地开发存储空间,使容纳的数据量相当于20张蓝光DVD光盘或者100张标准DVD光盘的容量。我国也在积极寻求电子文件的管理对策。一是提出了电子文件归档分三步走:(1)由档案部门和文书处理部门合作,在电子文件形成或收到的同时,对列入归档范围的文件进行逻辑归档;(2)在有逻辑归档标识的电子文件办理完毕后,由专人对电子文件进行真实性和完整性检验,检验无误的制成纸质文件,与该电子文件的物理载体建立互联同时归档;(3)对有逻辑归档标识的电子文件定期进行物理归档。二是定期统一把符合归档条件的电子文件信息联机传送,按档案的统一格式集中存储到脱机载体上。三是对具有保密要求的电子文件,按相关法规制订保密措施,严防涉密电子文件在网络开放。2.2规范电子文件管理途径,加快相关标准的制定。加快相关标准的制定,使电子文件的归档管理做到有章可循,保证电子文件从生成到归档管理上的连续性和规范性,这是最终确定电子文件法律地位的必要条件。目前,国际上有《PDF》等标准4个;国内已经出台的档案信息化和电子文件管理方面的国家、行业、地方标准多达21部,正在制订和修订的档案信息化标准有18个。各地方性电子文件标准也在陆续出台中。2.3加强法制建设,逐步形成完善的电子文件管理法律体系。电子文件的长期保存与利用需要法律支撑,没有法律支持的电子文件就没有保存意义。我国档案行政主管部门正会同政府信息产业部门,联合制定电子文件管理办法,确认电子文件的法律地位,规定用统一的软硬件设施来管理电子文件;同时,加强归档管理,增设相应的机构,行使监督、检查、指导的职权。2.4使电子文件归档时改变结构,脱离原来的软、硬件环境。针对电子文件对设备依赖的特性,一些国家采取相应措施,使电子文件脱离原来的软、硬件环境,达到长久保存的要求。如挪威承担了北欧国家共同的“电子文件管理工具(TEAM)”项目的开发。该工具软件包将ORCLE数据库文件以展开方式存储,去掉了元数据库复杂的索引结构,使电子文件的保管不再受元数据库的条件限制。在日后需要使用这些电子文件时,可通过SQL结构化查询语言检索。虽然效率较低,但通过SQL仍可重建原始数据库的逻辑结构。美国国家档案与文件署与国家科学基金会合作开发了ISO标准,并已在2007年试行,整个系统预计到2011年4月正式完成。该系统从统一性和综合性层面支持电子文件管理,而忽略对实现这个系统的信息技术构架的定位。它的功能(服务)在于:无论身处何地,公众都能通过因特网利用政府电子文件,并能从国家档案馆、总统图书馆和联邦文件中心发送、检索电子文件。该系统在支持档案馆的电子文件管理过程中,支持所有电子文件原创者和档案馆保存电子文件的集成方法,且支持范围延伸到所有电子文件管理的基本过程。与系统支持电子文件管理的方法和如何定位其他类型的电子文件不同,这个系统还支持对利用电子文件所产生的信息、信息记录者以及形成电子文件的全过程管理。总部设在加拿大的大不列颠哥伦比亚大学的多学科合作项目——“永久保护真实电子文件国际研究”(INTERPARES),其重点研究方向就是保存真实电子文件的必要条件。我国目前还未发现采用上述方法的尝试,原因是我国信息化建设起步较晚,信息技术相对落后,加之幅员辽阔,情况复杂,用一个软件包对多种数据库的电子文件进行展开处理非常困难。另外,被展开存储的电子文件,能否恢复其原有的模式尚存在争议。2.5对电子文件法律地位问题的解决。档案的基本价值是凭证价值和参考价值,尤以凭证价值最为重要。虽然,目前人们对数字化档案具有参考价值这一点已无疑义,但是,由于一系列技术和立法问题还未解决,数字化档案目前还不具备凭证效力。在电子文件的法律效力问题还没有很明确的解决方法之前,面对大量产生的电子文件,不少国家已对此作出规定,即以严格的管理程序来保证电子文件的凭证作用。如加拿大等国家规定,符合国家规定的管理程序产生的电子文件具有凭证作用。不过在实际操作中,并不是所有的法庭都认可电子文件的凭证作用。目前我国对电子文件的凭证作用也没有很明确的规定,只是把这个问题包含在计算机信息系统的整体法律认定上。例如,具有法人资格部门的计算机系统产生的电子文件记录对该部门的活动具有凭证作用。很多国家当前也是采用了这种对策。看来,解决这个问题除了行政办法外,还要依靠更加严格的技术措施才行。2.6加强对电子文件管理知识的培训,提高档案工作人员的业务素质。面对大量出现的电子文件,档案人员光懂纸质档案管理知识是远远不够的,必须学习电子文件管理知识,才能跟上时代步伐。可从三个方面进行培训:(1)分期分批对档案人员进行电子文件管理知识的培训;(2)采取“走出去请进来”的方法,组织档案人员学习外单位在电子文件管理方面取得的经验;(3)召开现场会,及时总结经验和教训,拓宽业务见识,增强业务素质。2.7加快档案信息资源建设进程,提高电子文件利用的质量。现阶段,在做好电子文件归档管理工作的同时,要继续采用通用标准和先进技术,做好传统载体档案的数字化工作,整合安全完备的信息资源。针对传统用户与网络用户并存的现实,在构建档案信息资源体系时,找到实体资源建设和数字化资源建设之间的“虚”“实”平衡点,在基于用户需求的网络服务平台上,满足多样化用户的利用需求。此外,提高用户信息素质,也是档案信息资源服务部门的职责。在构建复合服务模式时,应培育和引导用户提高信息利用素养:(1)培养信息意识。通过日常宣传和网站推广等措施对用户进行档案信息意识教育,提升全社会档案意识,增强用户利用档案信息资源的自觉性。(2)培养信息获取能力。针对档案信息资源的特点和利用要求,提升用户利用档案信息的能力,让用户既可在传统利用服务模式下查阅所需信息,又能在网络环境下检索所需的资源。(3)培养信息道德。通过对用户进行信息道德教育,提高用户信息道德水准,减少档案信息利用风险。2.8构建知识创新与服务的大平台——知识网格。知识网格是伴随着互联网的迅速发展而创建的服务平台,它使整个互联网变成一台巨大的超级计算机,像电力网供电一样,能将相兼容的任何设备,在任何时间、任何地点插入网格,实现计算、存储、数据、信息、知识、专家等资源的全面共享。它的本质特征不是网格规模,而是协同工作、资源共享,消除资源孤岛。在知识网格中,灵活的、可扩展的信息服务体系结构,能够保证资源信息提供者和信息服务者的广泛分布性,避免由于单个信息服务实体的失败导致其他资源信息服务不能正常提供服务。知识网格中的所有元数据构成元数据目录,这种目录结构系统具有层次和分布式的特性,不但不会破坏现有系统的元数据描述方法,还能与它们很好地交互、融合。总之,电子文件的长期保管和开发利用,是档案界不可回避的使命,机遇和挑战并存,档案工作者应以积极的态度,努力提高自身素质,更新知识储备,完善电子文件长期保存和利用的管理方案与技术措施,以饱满的热情和充足的信心,迎接知识网络时代的到来!网络环境下文档管理工作的应对策略余厚洪面对一系列新情况、新变化,视而不见、回避问题显然无济于事,必须寻找跻身网络社会的路径,使网络环境下的文档管理工作获得长足发展。1.推行电子文档的逻辑管理传统文档载体与信息“二位一体”不可分离,电子文档的信息可以在载体之间传递与迁移,正是这种不同的特性使两者管理的主要方式截然不同:传统纸质文档以物理管理为主,电子文档以逻辑管理为主。所谓物理管理,就是按照形象思维的方式,以文档的物质载体为出发点来进行文档管理的工作方式。所谓逻辑管理,就是按照抽象思维的方式,以文档的信息内容为出发点来进行文档管理的工作方式。特别值得一提的是,电子文档的虚拟化逻辑管理,将传统档案管理的种种不可能转变成虚拟空间的种种可能,如:档案信息按照不同的逻辑命令进行自由组合;深入到字词(有具体含义的实词)级管理,能实现对电子文档全文检索与管理;实现网状多媒体互动式阅读。可见,电子文档的逻辑管理是超越传统意义上的逻辑管理。2.确保文档信息的长期可读保证电子文档长期可读,是对信息进行利用和研究的出发点。国家档案管理部门应当与IT部门合作,讨论与研制“绝对”电子版的长期保存问题[2],因为许多电子公文不一定都可能产生硬拷贝供档案馆长期管理。在管理过程中,对于保存数据的电子载体,应经常进行检测,判定被检测载体是否需要重写或更新,对检测出错的载体进行有效的修正或更新,以防突然损坏造成数据丢失,需要长期保存的数据还得及时做好转换工作。在进行有效性验证时,建议做到:每满1年对电子文档形成单位和档案保管部门的设备更新情况进行一次检查登记;每满2年进行一次抽样机读检验,抽样率不低于10%,发现问题及时采取恢复措施;设备环境更新时应确认库存载体与新设备的兼容性,不兼容时应进行电子档案的载体转换工作,原载体同时保留时间不少于3年;磁性载体存贮的电子档案,每4年转存一次,原载体同时保留时间不少于4年。3.维护电子文档的信息安全电子文档管理是一种风险管理,在管理过程中,应特别重视:(1)防范病毒侵袭。运用防火墙、漏洞扫描技术、
本文标题:电子文件长期保存格式探析
链接地址:https://www.777doc.com/doc-75627 .html