您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > 数据元标准化基本原则与方法
科学数据共享工程技术标准SDS/T2132—2004××××-××-××发布××××-××-××实施中华人民共和国科学技术部发布数据元标准化的基本原则与方法Thebasicprinciplesandmethodsforthestandardizationofdataelements(征求意见稿)(本稿完成日期:2005年5月)SDS/T×××—2004II目次前言................................................................................IV1范围................................................................................12规范性引用文件......................................................................13术语和定义..........................................................................14数据元概念..........................................................................44.1数据元基本概念....................................................................44.2数据元与其它数据概念的关系........................................................55数据元的表达格式....................................................................65.1数据元基本属性....................................................................65.2数据元属性描述符..................................................................76数据元的提取........................................................................76.1自上而下的数据元提取法............................................................76.2自下而上的数据元提取法............................................................87数据元的分类........................................................................87.1数据元分类方案....................................................................87.2数据元的分类属性..................................................................98数据元的标识........................................................................98.1数据的标识结构原则................................................................98.2数据注册标识的规则...............................................................109数据元的命名规则...................................................................119.1名称语义内容的规则...............................................................119.2名称格式的规则...................................................................139.3唯一性规则.......................................................................1410数据元的定义......................................................................1410.1数据元定义规则..................................................................1410.2数据元定义指南...................................................................1411数据元值域及其表达模式............................................................1511.1穷举域..........................................................................1511.2可重复利用域....................................................................1511.3数据元值域的规范定义和来源......................................................1512数据元目录标准编写格式............................................................1612.1数据元目录标准格式..............................................................1612.2数据元目录的一般格式............................................................17附录A(规范性附录)..................................................................18A.1数据元属性的描述方法..............................................................18A.2标识类属性........................................................................18A.3定义类属性........................................................................19A.4关系类属性........................................................................20A.5表示类属性........................................................................21A.6管理类属性........................................................................23SDT/T×××—2004IIIA.7附加类属性........................................................................23附录B(规范性附录)..................................................................24B.1数据元的标识......................................................................24B.2数据元的注册......................................................................24B.3注册系统..........................................................................25B.4注册参加机构......................................................................26SDS/T×××—2004IV前言科学数据共享活动既涉及科学数据的汇交、分发、服务和应用环节,也涉及科学数据的采集、加工和处理环节。在这一系列环节中,常见的工作内容之一是用数据元(如数据库中的数据字段)的形式确立某种类别的数据在其名称、含意、表示格式、标识等方面的特征,用数据的分类与编码(如科学数据分类与代码)的形式确立对某种类别的数据所作的进一步的分类并对分类结果赋予特定代码,以达到对该种数据类别或其分类结果在语义上的无歧义理解。但需要特别强调的是:一方面,数据元遴选和确立的好坏,将直接影响数据组织、生产、交换和共享的效率和质量,严重时还会导致重复的投入和建设;另一方面,数据元的遴选和确立结果要被不同的信息系统或应用系统所共享,就必须在各相关方之间建立大家一致认可的相关标准或规范,否则会导致大量的转换工作甚至无法实现共享。为此,采用何种原则和方法开展数据元标准化工作,可有效规避风险,提高数据组织和生产的效率和质量,达到共享目标,是科学数据共享活动面临的任务之一。本标准正是基于上述现实要求而提出和制定的,其目的是确立面向科学数据共享活动的数据元标准化的基本原则与方法,指导和规范科学数据共享工程各建设单位研究和制定与各种科学数据的采集、加工、处理、汇集、分发、服务和应用相关的通用或专用的数据元目录(又称字典)标准,推动和促进科学数据的集成与共享。按照向上积极采用适宜的国际标准或国家标准,向下突出科学数据共享活动的特点和需求的原则,本标准参考了包括GB/T18391《数据元的规范与标准化》在内的大量国家标准,并结合了各种类型的科学数据库建设和整合以及科学数据交换、共享、服务和应用对数据元标准化工作的特定需求。本标准为第一次制定。本标准由科学数据共享工程办公室提出。本标准由科学数据共享工程办公室归口。本标准主要起草单位:本标准主要起草人:SDT/T×××—20041数据元标准化的基本原则与方法1范围本标准围绕各种类型的科学数据库建设和整合以及科学数据交换、共享、服务和应用对数据元标准化的需要,规定了数据元的提取、命名、标识、描述、分类、值域范围确立的基本原则与方法,数据元目录的格式规范,以及整个科学数据共享工程中数据元的维护与管理层次与机制。本标准适用于科学数据共享工程各建设单位研究和制定通用和专用的数据元目录(又称数据元字典)标准。本标准的目的在于给出科学数据共享工程、各领域、主体数据库三个层面的数据以及关联数据,在其特定的语境中,数据单元标准化的原则、方法以及管理的机制和模式。它不仅是科学数据共享中三个层面各自内部数据规范的原则与方法,同时也是相关元数据元素和元数据内容规范的原则与方法。它不仅是科学数据大平台建设中数据规范、公共数据元目录编写必须遵循的原则与方法,更是各试点单位相关库结
本文标题:数据元标准化基本原则与方法
链接地址:https://www.777doc.com/doc-5653580 .html