您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 国内外标准规范 > DB13T 2351.2-2016 标准文献结构化数据规范 第2部分指标元数据
ICS01.140.20A14DB13河北省地方标准DB13/T2351.2—2016标准文献结构化数据规范第2部分:指标元数据StructureddataspecificationsofstandarddocumentsPart2:Indicatormetadata2016-05-23发布2016-07-01实施河北省质量技术监督局发布DB13/T2351.2—2016I目次前言................................................................................II引言...............................................................................III1范围..............................................................................12规范性引用文件....................................................................13术语和定义........................................................................14指标元数据的属性..................................................................25指标元数据模型....................................................................26技术指标元数据描述................................................................37指标元数据字典描述...............................................................108指标元数据扩展原则和方法.........................................................10附录A(规范性附录)标准文献指标元数据代码集.......................................11附录B(资料性附录)标准文献结构化指标元数据-字典描述..............................12参考文献............................................................................17DB13/T2351.2—2016II前言本部分按照GB/T1.1-2009给出的规则起草。DB13/T2351《标准文献结构化数据规范》包括了3部分:——第1部分:全文元数据;——第2部分:指标元数据——第3部分:元数据著录规则。本部分是第2部分,本部分与第3部分配套使用。本部分由河北省服务业标准化技术委员会提出并归口。本部分起草单位:河北省标准化研究院。本部分主要起草人:马星晓、施健、卢艳芳、郭天强、闫志强、李建勋、谢燕、张园园、陈南、赵倩、安姣。DB13/T2351.2—2016III引言标准文献电子文档格式有DOCX、数字版PDF、扫描版PDF。在生产、科研和管理过程中,往往需要定位到标准内容、指标信息上,如:检索标准指标、指标比对及标准水平分析等。但是,现有的标准文献电子文档为非结构化文档,这一特性决定它的内容检索指向性笼统模糊,故而,以非结构化文档为单元存储无法实现小颗粒度的指标数据的检索、比对分析。只有通过数据处理将非结构化文档转换为结构化或半结构化文档方能解决上述问题。为寻求上述瓶颈的突破,河北省标准化研究院在2012年将标准文献结构化列为重点科研项目,在此基础上,2013年又承担了国家标准化委员会标准化信息中心的《“双打”重点产品标准文献结构化内容数据库》项目,而实现标准文献结构化必须首要解决2个问题:1)结构化标准的数据结构问题,换而言之,标准结构化加工抽取出的数据是哪些数据?2)抽取出来的数据进行加工应符合什么样的数据规范要求,方能满足与原始标准文本内容的一致性的需求。解决第一个问题,需要建立标准结构化数据模型,并通过元数据规范来实现;解决第二个问题,需要建立数据的著录规则,实现数据的规范性。项目组在确定文献结构化抽取技术的基础上,对4000余项强制性国家标准的内容要素逐一进行了分析研究、归纳总结后,按UML思想确定了标准结构化数据模型,并在工程上对4000余项强制性国家标准进行了结构化数据的抽取验证,确定了结构化元数据。通过验证测试,逐步完善了加工抽取结构化数据的规范要求,形成了《标准文献结构化数据规范》。目前,在行业内广泛使用的GB/T22373-2008《标准文献元数据》是针对标准文献题录的元数据标准,侧重的是标准文献形式特征,而此次制定的《标准文献结构化数据规范》是关于标准内容结构化的全文元数据和指标元数据规范,希望此两个标准的结合使用,实现标准文献信息资源的统一描述,促进标准文献信息资源的开发利用。DB13/T2351.2—20161标准文献结构化数据规范第2部分:指标元数据1范围本部分规定了标准文献结构化技术指标元数据(以下简称指标元数据)的术语和定义、属性、数据模型、数据描述以及扩展原则和方法。本部分适用于标准文献结构化数据的处理。2规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T7408数据元和交换格式信息交换日期和时间表示法(GB/T7408-2005,ISO8601:2000,IDT)GB/T18391.3-2009信息技术元数据注册系统(MDR)第3部分:注册系统元模型与基本属性(ISO/IEC11179-3:2003,IDT)GB/T19710-2005地理信息元数据(ISO19115-2003,MOD)GB/T26816-2011信息资源核心元数据DB13/T2351.1-2016标准文献结构化数据规范第1部分:全文元数据3术语和定义下列术语和定义适用于本文件。3.1信息资源informationresource在政治、经济和社会等各领域产生和使用、具有各种载体形式的信息内容。[GB/T26816-2011,定义3.1]3.2元数据metadata定义和描述其他数据的数据。[GB/T18391.3-2009,定义3.2.18]3.3元数据元素metadataelement元数据的基本单元。注:元数据元素在元数据实体中是唯一的。[GB/T19710-2005,定义4.61]3.4元数据实体metadataentity一组说明信息资源相关特性的元数据元素。注:可以包含一个或一个以上元数据实体。[GB/T19710-2005,定义4.71]DB13/T2351.2—201623.5核心元数据coremetadata描述信息资源基本属性的元数据元素和元数据实体。[GB/T26816-2011,定义3.5]4指标元数据的属性本部分采用摘要表示的方法定义和描述标准结构化指标元数据,摘要内容包括以下八个属性:中文名称、英文名称、缩写名、定义、数据类型、值域、约束/条件、最大出现次数。4.1中文名称元数据元素或元数据实体的中文名称,用第6章中各条的标题来表达。4.2英文名称应符合DB13/T2351.1-2016中4.2的规定。4.3缩写名应符合GB/T26816-2011中4.6的规定。4.4定义应符合GB/T26816-2011中4.2的规定。4.5数据类型应符合GB/T26816-2011中4.4的规定。4.6值域应符合GB/T26816-2011中4.5的规定。4.7约束/条件应符合GB/T26816-2011中4.7的规定,约束/条件代码见DB13/TXXXX.1-2016附录A表A.1。4.8最大出现次数应符合GB/T26816-2011中4.8的规定。5指标元数据模型标准文献结构化指标元数据模型见图1。DB13/T2351.2—20163+标准对象:string+指标对象:string+指标对象属性:指标对象属性+指标影响因素:指标影响因素+指标名称:string+指标内容:string+计量单位:string+指标注:string+表注:string+试验方法:string-指标组ID:string+指标对象属性名称:string+指标对象属性值:string+指标对象属性类型:string+指标影响因素名称:string+指标影响因素值:string+指标影响因素类型:string+更新时间:string+记录状态:string+版本:string+加工单位:string+指标状态:string+是否强制:bool+指标类型:string+指标性质:string+标准号:string+标准名称:string+篇章条编号:string+表号:string+表名:string10..*10..*11..*+标识符:string+技术指标:技术指标+版本信息:版本信息+位置信息:位置信息+类别状态信息:类别状态信息111111..*图1指标元数据模型6技术指标元数据描述6.1技术指标元数据中文名称:技术指标元数据英文名称:TechnicalIndicatorMetadata缩写名:TechIndMdata定义:描述结构化标准中技术指标数据的元数据。数据类型:复合型约束/条件:M最大出现次数:16.2标识符应符合DB13/T2351.1-2015中6.2的规定。6.3技术指标中文名称:技术指标英文名称:TechnicalIndicator缩写名:TechInd定义:描述标准质量特性指标的一组信息。数据类型:复合型约束/条件:M最大出现次数:16.4标准对象中文名称:标准对象DB13/T2351.2—20164英文名称:documentobject缩写名:docObj定义:描述一个实体的标准化活动的作用对象。数据类型:字符串值域:自由文本约束/条件:M最大出现次数:16.5指标对象中文名称:指标对象英文名称:indicatorobject缩写名:indObj定义:描述一个实体的质量特征的作用对象。数据类型:字符串值域:自由文本约束/条件:M最大出现次数:16.6指标对象属性中文名称:指标对象属性英文名称:IndicatorObjectAttribute缩写名:IndObjAttr定义:描述指标对象特征、特性的一组信息。数据类型:复合型约束/条件:O最大出现次数:N6.7指标对象属性名称中文名称:指标对象属性名称英文名称:indicatorobjectattributename缩写名:indObjAttrNm定义:描述指标对象的特性、特征的名称。如:形状、颜色、气味、优劣、用途等都是指标对象的性质。数据类型:字符串值域:自由文本约束/条件:M最大出现次数:16.8指标对象属性值中文名称:指标对象属性值英文名称:indicatorobjectattributevalue缩写名:indObjAttrVal定义:描述指标对象属性的内容。数据类型:字符串值域:自由文本约束/条件:M最大出现次数:16.9指标对象属性类型DB13/T2351.2—20165中文名称:指标对象属性类型英文名称:indicatorobjectattributetype缩写名:indObjAttrTyp定义:描述指标对象的类别。数据类型:字符串值域:字典约束/条件:O最大出现次数:N6.10指标影响因素中文名称:指标影响因素英文名称:IndicatorInfluencingFactor缩写名:IndInfluFact定义:描述与指标数据有关的一组信息。数据类型:复合型约束/
本文标题:DB13T 2351.2-2016 标准文献结构化数据规范 第2部分指标元数据
链接地址:https://www.777doc.com/doc-8093633 .html