国外元数据标准比较研究报告中文文献元数据标准研究项目组系列报告之一国外元数据标准比较研究报告中文元数据标准研究项目组(2000年12月)一、术语以及研究方法元数据:目前关于元数据的定义很多,比较常规的是:元数据是关于数据的数据(dataaboutdata)。但这个定义过于简洁和宽泛。本报告中所讨论的元数据定义是:元数据是描述某种类型资源(或对象,object)的属性、并对这种资源进行定位和管理、同时有助于数据检索的数据。元数据标准:如何描述某些特定类型资料的规则集合,一般会包括语义层次上的著录规则,和语法层次上的规定。语法层次上的规定有:描述所使用的元语言,文档类型定义使用什么语法,具有内容的元数据的格式(也可以包括内容数据,即CONTENT)及其描述方法。元数据标准框架:规范研究定制某种特定资源所用的元数据标准时,需要遵照的标准(换言之,抽象化的元数据)或规则。它从更高层次上规定了元数据的功能、结构、格式、设计方法、语义语法规则等多方面的内容,在更多意义上是一个方法论的概念。SGML:标准通用置标语言,当前用于描述元数据的标识语言。XML:可扩展标记语言,将是选定的传输语言,以及描述SCHEMA的语言。RDF:资源描述框架,携带多种元数据标准的数据的容器,用于结构化的元数据进行编码、交换和再利用的基础架构。编码(Encoding)规则:编码规则用于数据交换。为了适合传输和存储,编码规则要可以将数据信息按独立于系统的数据结构进行编码。编码规则说明编码数据的类型、有序排列、结构和编码模式,用于执行编码服务。1997年,IFLA的最终研究报告中提出,建议采用开发关系数据库系统时用到的概念模型的实体分析技术来研究书目记录数据元素框架,包括6个步骤,分离实体、属性标识、找出实体之间的关系、分析确定用户任务、映射用户任务的属性与关系和相关值评估、书目就数据元素级别。在以下对国外元数据标准的比较研究中,首先使用实体分析方法来探讨各个元数据标准是如何对著录对象进行描述的,从实体、属性、联系的角度分析各个标准中元素/字段的设置,定义。其次,还会从元数据标准的功能层次上来比较各个标准的功能。就数据交换和信息共享的需要而言,最重要的工作在于,得到别人的记录可以理解是什么含义?包括几个层次上的工作:元素说明,编码规则,记录格式:对于元数据中的各个元素或字段的内容序列化的方法。也即是按照如何的顺序和结构来组织各个元素及其内容的方法。例如MARC的2709,当编码规则使用置标语言的时候,通常会有两个层次上的格式,首先是置标语言本身的语法规则,其次是对记录中使用到的元素及其属性的说明(DTD或SCHEMA)第1页共21页1国外元数据标准比较研究报告中文文献元数据标准研究项目组系列报告之一二、主要元数据标准介绍本项目对国际上比较有影响的7种元数据进行了分析和比较,它们分别是CDWA、DC、EAD、FGDC/CSDGM、GILS、TEI、VRA,其后又参考了美国加州数字图书馆CDL使用的元数据、台湾大学Metalogy系统元数据、台湾中央研究院的元数据研究。这些元数据标准适用的著录对象基本涵盖了目前有的资料类型。CDWA(CategoriesfortheDescriptionofWorksofArt):艺术作品描述类目CDWA元数据标准是为从事艺术史研究、艺术品管理人员,以及信息技术专家而设计的元数据标准,用来描述艺术品,主要在博物馆界使用。CDWA格式的研究机构是theArtInformationTaskForce(AITF)。主要赞助机构有theJ.PaulGettyTrust,同时还得到了来自fromtheNationalEndowmentfortheHumanities(NEH)给予theCollegeArtAssociation(CAA)的为期两年的配套津贴,目前,CDWA的维护机构是theGettyResearchInstitute()。标准文件URL:。CDWA元数据标准的元素(categories)包括27个一级元素,有些元素下还有下一级的子元素。描述实体内容的元素元素名定义OBJECT/WORK描述作品的类型和数量的标识。CLASSIFICATION:分类ORIENTATION/ARRANGEMENT:方位/布置描述作品被展示陈列的安排方式,或从外部观察到的方位特征。TITLESORNAMES:题名著录艺术品的名称,名称的类型,以及此名称是在何时被使用的。STATE:状态对于可能会制作多个的艺术品(例如印刷品),状态元素描述了处于不同制作阶段的同一作品的在阶段方面的关系。EDITION:版本当某一个艺术品是根据一个原件复制发行(例如版画)时,在“版本”下著录此特定作品的。PHYSICALDESCRIPTION:物理描述在这个元素中要用普通而非专业术语的语言来描述作品的外观,要著录的包括可辨认的图案的名称、主旨,或用来装饰作品的纹理。MEASUREMENTS:度量著录关于艺术品的尺寸、形状、度量等信息。INSCRIPTIONS/MARKS:题铭/标志说明艺术品上的可资鉴别的物理记号,书写的文字,注解,正文,或作为此艺术品一部分铭刻、书写、黏附其上的标签。CREATION:责任项在这个元素要描述与艺术品的制作、设计、执行等过程中,与这些行为有责任关系的人物,时间,地点的信息。STYLES/PERIODS/GROUPS/MOVEMENTS:描述与艺术品相联系的历史时期,风格等信息。第2页共21页2国外元数据标准比较研究报告中文文献元数据标准研究项目组系列报告之一风格/时期/流派/运动SUBJESTMATTER:主题CONTEXT:艺术品的制作或产生可能与一些政治、经济或宗教性事件相联系,另外艺术品的位置可能是在建筑内部或凹室里,在此元素里描述它在历史上和空间上的位置(时间或空间范畴的上下文联系)。RELATEDWORKS:相关作品RELATEDVISUALDOCUMENTATION:相关可视资料信息如果有关于此作品的图象或其他视觉材料,在此元素下著录对于图象的描述信息。RELATEDTEXTUALREFERENCES:对艺术品的描述、记载可能出现在公开出版物、档案或手稿等文字材料里,在这个元素将著录对这些文本的参考信息。CRITICALOPINIONS:评论由艺术家、艺术史专家、评论家等给出的对艺术品的评论。DESCRIPTIVENOTE:附注与形成著录对象有关的技术,材质的说明MATERIALSANDTECHNIQUES:材质/技术描述一件艺术品是用什么物质或材料制成的,这些材料是通过什么方式组织在一起的,以及制作加工的技术,处理,组装过程中用到的方法。FACTURE:制作方法这个元素里会详细描述、讨论艺术品的制作方式。包括它的作工、制作特点,或建筑方法,抑或是技术上的特殊之处。艺术品的保存、表现方面的记录CONDITIONS/EXAMINATIONHISTORY条件/检查历史在这个元素里记录在特定时间对艺术品的物理条件、特点、完整性所做的评价。包括对艺术品在特殊条件下的检查结果,例如紫外线,但不包括会改变艺术品本身条件的检查(例如修复)。CONSERVATION/TREATMENTHISTORY:保存或处理历史艺术品经过修补、保存、稳定化等处理的历史记录。OWNERSHIP/COLLECTINGHISTORY:作品的被藏历史记录描述艺术品的起源或流传的经过,包括从它被制作到现今为止的收藏历史,以及失窃、损毁、改观等情况。EXHIBITIONS/LOANHISTORY:展览/出借历史在此元素下著录关于一件艺术品在各个地方公开展览的历史信息。管理性信息CATALOGINGHISTORY:编目历史著录书目记录的创建、修改的信息。包括原始编目人员、编目时间和相关信息,以及后续修改的信息COPYRIGHTS/RESTRICTIONS:版权/约束对艺术品具有使用,展出,或复制权利的个人或团体的权利说明。CURRENTLOCATION:当前位置著录艺术品目前被收藏在何处,地理位置第3页共21页3国外元数据标准比较研究报告中文文献元数据标准研究项目组系列报告之一OBJECT/WRKCATEGORIES(formuseumobject,architecture,volume,group)ArtistIdentificationPlace/LocationIdentificationGenericConceptIdentificationSubjectIdentificationRelatedVisualDocumentationRelatedTextualReferencesRelatedWorksCDWA元数据标准是针对描述艺术品的需求而设计的,艺术品首先是具有物理形态的,也可能同时具有数字化了的图象,此外时空、人物、历史文化等方面的上下文关系在描述一件艺术品时也时非常重要的,CDWA中有很多元素都反映了艺术品特有的这些特点。有代表性的有:Orientation/arrangement(方位/布置)、Inscriptions/Marks(题铭/标志)、Style/Periods/Groups/Movements(风格/时期/流派/乐章)、Context、Criticalopinions(评论)。物理形态方面有:Measurement(度量)、MaterialsandTechniques(材质/技术)、Physicaldescription(物理描述)。此外,在对艺术品的保存、管理方面的内容也有一些很有特色的元素来描述,如:Conditions/ExaminationHistory(条件/检查历史)、Conservation/TreatmentHistory(保存/处理历史)、Ownership/CollectionHistory(拥有/收藏历史)、Exhibitions/LoanHistory(展览/借出历史)。DC(DUBLINCORE)都柏林核心元素集DUBLINCORE元数据格式描述的对象是网络资源。最初由美国OCLC公司发起,国际性合作项目DublinCoreMetadataInitiative设计,由参与合作项目的机构共同维护修改,每年都召开workshop,并在会上提出新的修改意见。最初设计时间和地点为1995年在Ohio州OCLC公司所在地Dublin市召开的一次国际性研讨会上。目前最新版本为version1.1,1999年7月2日发布执行。最初应用目的是为了网络资源的著录与挖掘,由于DC元素简单易用,加之OCLC的大力推广和网络资源著录的巨大需求,DC发展成为可用于任何媒体。简单的元素定义和设置可以很方便的著录,是DC获得广泛应用的重要原因,然而它也带来另外一个问题,对著录对象的描述深度不够,不能进行专指度较高的检索。DC元素基本描述根据DC1.1版本,DC由15个元素组成,每个元素都根据ISO/IEC11179定义十个属性,即:名称(Name):元素名称标识(Identifier):元素唯一标识第4页共21页4国外元数据标准比较研究报告中文文献元数据标准研究项目组系列报告之一版本(Version):产生该元素的元数据版本注册机构(RegistrationAuthority):注册元素的授权机构语言(Language):元素说明语言定义(Definition):对元素概念与内涵的说明选项(Obligation):说明元素是限定必须使用的还是可选择的数据类型(Datatype):元素值中所表现的数据类型最大使用频率(MaximumOccurrence):元素的最大使用频次,即是否可重复使用注释(Comment):元素应用注释DC元素依据其所描述内容的类别和范围可分为三组:1.对资源内容的描述;2.对知识产权的描述;3.对外部属性的描述(instantiation)。资源内容描述类知识产权描述类外部属性
本文标题:国外元数据标准比较
链接地址:https://www.777doc.com/doc-4993375 .html