您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 人事档案/员工关系 > ww基于Dspace构建甘青特有少数民族数字资源保存与服务系统
基于Dspace构建甘青特有少数民族数字资源保存与服务系统马建霞祝忠明王渊命常宁杨裔majx@lzb.ac.cn2006青岛中国科学院资源环境科学信息中心中国科学院国家科学图书馆兰州分馆纲要系统概况关键需求分析Dspace的特点Dspace在甘青特有少数民族数字资源保存与服务系统中的应用和改进1甘青特有少数民族数字资源保存与服务系统概况甘青特有少数民族数字资源保存与服务系统是一个集少数民族数字资源的保存、管理和服务为一体的信息系统。系统将对甘青地区特有的东乡族等少小民族的相关历史、文化、经济、资源、环境的多媒体信息资源进行组织整理和发布,从而达到利用现代信息技术保存、传播和开发利用少数民族历史、文化、社会、经济、自然资源、地理环境信息,为少数民族研究提供基于网络的信息获取和交流平台,为民族地区区域可持续发展研究和决策提供信息支持,服务于民族地区的小康建设和可持续发展的目标。本系统研究开发以中科院资源环境科学信息中心为主,参加者包括兰州大学、西北民族大学、甘肃省民族委员会、甘肃省图书馆等单位或相关人员。2项目关键需求分析数字资源长期保存需要从利于长期保存的角度考虑数字资源的描述语言、遵循标准、数字对象存储格式、数字对象的标识符等。多类型资源的集成揭示信息类型众多,有:图书、图书章节、期刊论文、照片、录音、录像等视听资料、报告、表格、地图、口述访谈等,主题复杂,包括历史源流、哲学宗教、民俗习惯、文化艺术、资源环境、社会事务等,所收录资料的主题和所涉及的民族之间的关系又有二维交叉关系;同时民族的分布又具有一定的地域特征。因而不仅需要符合一定标准的方式对各种类型的资源进行描述,同时对于民族数字资源的语义组织管理来说,资料的揭示必须从文献主题、文献类型、民族、地域等多方面立体地展开,并提供多途径交叉的浏览导航功能。2项目关键需求分析(续)数字资源分布式协作管理甘青特有少数民族数字资源系统项目成员来自不同的单位,形成了一个分布式的虚拟组织,其数字资源的组织管理要求基于WEB进行分布式管理和协作,要求这些空间上分布而工作上又相互依赖的多个协作成员及其活动有机地组织起来,以共同完成某项任务。基于工作流和用户角色权限的质量控制为了保证搜集、保存的信息资源的质量,有必要根据不同的用户组设置不同的权限,比如具有超级用户权限的系统管理员、对栏目信息进行组织管理的栏目管理员、对元数据编辑审核的审核员、数据录入员、研究级用户、一般用户等。工作流的支持一方面利于分布式的协作,另一方面也利于保证数据的质量控制。2项目关键需求分析(续)开放获取和信息聚合通过开放获取和信息聚合手段,围绕特定的学科或主题领域对分散的机构知识库中的信息进行再发现、再组织和集成,可以更加快速地建立起符合科研人员获取和利用学科信息习惯的数字知识库系统,同时也将使信息资源库的内容被更广泛地发现和利用。目前我们的项目主要围绕甘青特有少数民族展开,我们相信会有更多的有关各个少数民族的内容管理系统提供开放的信息服务功能,因而从系统长期持续发展的角度考虑,应该支持开放获取和信息聚合。应用层统计工具Web用户界面OAI-PMH数据服务导入/导出工具媒体过滤器METS导出Dspace公共API业务逻辑层核心工具(配置、登录)搜索引擎历史纪录用户/用户组管理浏览工具内容管理管理工具Handle服务器存储插件Handle管理器提交工作流管理授权存储API存储层RDBMSJDBCPostgreSQLOracle比特流存储管理文件系统SRB3Dspace的特点Dspace的体系结构Dspace的数据模型Dspace的元数据描述型元数据每个条目都有一个DC元数据记录,其他的描述性元数据保存在序列化的比特流中,社群(community)和资源集合(collecitons)在DBMS中有一些简单的描述性元数据管理型元数据这包括保存元数据,来源和授权政策数据。结构化元数据这包括如何向最终用户展现一个条目,或者一个条目中的比特流,以及条目的不同组成部分的关系。比如,一篇由多个TIFF图片组成的学位论文,每个图片都是论文的单独一页,结构化元数据将说明每个图片就是一页,而且说明这些TIFF图片的顺序。Dspace的标示符Handle保存的一个重要方面是命名;DSpace采用CNRI的HandleSystem来标识社群(Community)、资源集合(Collection)、条目(Item)等存档对象。HandleSystem做为一种新兴的分布式的全球化命名和解析服务系统,可以为存档对象分配和赋予具有全球唯一性和持久性的标识符,并可以获得全球性的解析和定位服务,确保了所标识的对象可以在全球范围内被有效地引用和参考。比特流标识符每个比特流都有个38位的内部ID,这不同于比特流表的主键,在比特流存储管理器外事看不到的。它被用作决定比特流在传统存储或SRB存储中的具体位置,Dspace的工作流Dspace在甘青特有少数民族数字资源保存与服务系统中的应用甘青特有少数民族数字资源系统的设计结合以OAIS(OpenAchieveInformationSystem)开放存档信息系统模型和Dspace的基本框架作为础,同时考虑系统知识导航和概念检索需要,在OAIS模型中引入了知识组织系统,构建了本系统的功能结构模型功能框架采集与摄入模块表单提交开放获取和聚集数据批量导入存档与管理模块用户/用户组权限管理用户注册登陆工作流管理栏目管理元数据编辑知识组织标识符管理存储与索引维护发布与服务模块SIPAIP一般检索及相关关键词扩展检索多途径浏览订阅个性化Reasearcher工具OpenURLAnada原文传递连接OAI-Provider/RSSDIPDspace在甘青特有少数民族数字资源保存与服务系统中的应用和改进界面的本地化浏览器↔Web(应用)服务器↔Web应用↔JDBC↔数据库各个环节的本地化对中文检索的支持(Lucene)对中文浏览的支持(首字母音序排序)建设知识组织体系,改进对检索的支持建设知识组织体系,改进对检索的支持元数据提供了对资源各种属性的描述,但一条元数据记录不能充分反映出资源实体间的语义关联。比如,元数据只能揭示资源的主题,而不能揭示主题之间的关系,元数据中的知识体系是割裂的。因此,需要有一个机制来发掘和揭示消失在元数据中的知识体系,使离散的知识点成为相互关联的,可以在其间漫游的知识网络以支持系统的知识导航和概念检索。因此,在本系统中引入了知识组织系统。创建主题词表和对应的分类表。主题词表中除了有该主题款目的名称、对应的类号外,还有用、代、属、分、族、参五个字段。分类表中提供了类号、类名和它的直接上下位类号。首先提供了知识组织体系的维护功能,提供了两种模式的维护:基本模式可以直接填加表单信息,树型模式可以利用增删移动修改树结点的方式实现。然后提供了基于词表查词、浏览的标引功能。这样在用户察看文档信息时,程序会利用该文档的关键词,从主题词表中搜索出该文档关键词的用、代、属、分、族、参概念,作为相关关键词。数据检索时,也会在搜索结果下面列出相关关键词。这样,就为用户提供了基于主题词表概念关系的扩检、缩检途径。建设知识组织体系,改进对检索的支持基于Ajax框架提供多途径浏览、导航功能基于Ajax(AsynchronousJavaScriptandXML)的动态加载节点的树结构,采用J2EE多层架构,树节点的描述信息采用数据库存储,以可扩展标记语言(eXtensibleMarkupLanguage,简称XML)展现给JavaScript解析,支持无刷新地增加、删除、更新节点信息,以及拖放节点来改变树的结构和节点间的次序。Ajax相当于在用户和服务器之间加了一个中间层,使用户操作与服务器响应异步化。并不是所有的用户请求都提交给服务器,像—些数据验证和数据处理等都交给Ajax引擎处理,只有确定需要从服务器读取新数据时再由Ajax引擎代为向服务器提交请求。这样就把一些服务器负担的工作转嫁到客户端,利用客户端闲置的处理能力来处理,减轻服务器和带宽的负担。研究型用户个性化工作空间为了有针对性地提供甘青特有少数民族数字资源系统用户的个性化服务,在原来Dspace基础上增加了研究型用户个性化工作空间。不仅可以组织和显示研究型用户尚未完成的提交,并继续该工作,还显示出他所在的工作流程中未完成的任务,同时还允许他们将系统以外他所感兴趣的信息链接到这个个性空间。此外,该工具还提供了设定个人主页,并提供了设定公开或者不公开该页面的选项。研究型用户个性化工作空间5.下一步应用的考虑Dspace1.4.1新功能与当前功能的整合OAIharvester的开发统计功能的完善参考文献1DSpaceSystemDocumentation,2ConsultativeCommitteeforSpaceDataSystems.ReferenceModelforanOpenArchivalInformationSystem(OAIS).(AccessedJune.17,2006)3DspaceInstances.(AccessedApr.12,2006)4RobertTansley,MickBass,andMacKenzieSmithDSpaceasanOpenArchivalInformationSystem:CurrentStatusandFutureDirections.=27127&arnumber=1204846,(AccessedJan.12,2006)5ApacheLuceneSandbox.(Accessed,Feb.24,2006)6MichaelJ.Bass,DavidStuve,RobertTansley,etc...DSpace–ASustainableSolutionforInstitutionalDigitalAssetServices–SpanningtheInformationAssetValueChain:Ingest,Manage,Preserve,Disseminate,(AccessedJan.12,2006)7(AccessedJan.12,2006)8(AccessedFeb.20,2006)9(AccessedFeb.20,2006)10TheHandleSystem.(AccessedFeb.20,2006)1112BrianF.Lavoie,TheOpenArchivalInformationSystemRefe
本文标题:ww基于Dspace构建甘青特有少数民族数字资源保存与服务系统
链接地址:https://www.777doc.com/doc-2857273 .html