您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 国内外标准规范 > 科学数据共享工程-数据分类与编码基本原则与方法060214
科学数据共享工程技术标准SDS/T2121—2004××××-××-××发布××××-××-××实施中华人民共和国科学技术部发布数据分类与编码的基本原则与方法Thebasicprinciplesandmethodsfordataclassifyingandcoding(本稿完成日期:2005年12月)SDS/T2121-20041目次前言.................................................................................21范围.................................................................................32规范性引用文件.......................................................................33术语和定义...........................................................................34数据分类的基本原则...................................................................54.1稳定性.............................................................................54.2系统性.............................................................................54.3可扩充性...........................................................................54.4兼容性.............................................................................54.5综合实用性.........................................................................55数据分类的基本方法...................................................................55.1线分类法...........................................................................55.2面分类法...........................................................................75.3混合分类法.........................................................................86数据编码的基本原则...................................................................96.1唯一性.............................................................................96.2匹配性.............................................................................96.3可扩充性...........................................................................96.4简洁性.............................................................................97数据编码的基本方法...................................................................97.1代码类型...........................................................................97.2缩写码编码方法....................................................................107.3层次码编码方法....................................................................107.4复合码编码方法....................................................................117.5顺序码编码方法....................................................................127.6无序码编码方法....................................................................148代码设计............................................................................149数据分类与编码标准的编写规定........................................................15附录A(资料性附录)数据分类与编码标准的编写规定......................16A.1标准的一般结构....................................................................16A.2对一般结构的说明..................................................................16SDS/T2121-20042前言科学数据共享活动既涉及科学数据的汇交、分发、服务和应用环节,也涉及科学数据的采集、加工和处理环节。在这一系列环节中,常见的工作内容之一是用数据元(如数据库中的数据字段)的形式确立某种类别的数据所属的名称、含意、表示格式、标识等方面的特征,用数据的分类与编码(如科学数据分类与代码)的形式确立对某种类别的数据所作的进一步的分类并对分类结果赋予特定代码,以达到对该种数据类别或其分类结果在语义上的无歧义理解。但需要特别强调的是:一方面,数据分类与编码结果的好坏,将直接影响数据组织、生产、交换和共享的效率和质量,严重时还会导致重复的投入和建设;另一方面,数据分类与编码结果要被不同的信息系统或应用系统所共享,就必须在各相关方之间建立大家一致认可的相关标准或规范,否则会导致大量的转换工作甚至无法实现共享。为此,采用何种原则和方法开展数据分类与编码标准化工作,可有效规避风险,提高数据组织和生产的效率和质量,达到共享目标,是科学数据共享活动面临的标准化任务之一。本标准正是基于上述现实要求而提出和制定的,其目的是确立面向科学数据共享活动的数据分类与编码的基本原则与方法,指导和规范科学数据共享工程各建设单位研究和制定与各种科学数据的采集、加工、处理、汇集、分发、服务和应用相关的通用或专用的数据分类与代码标准,推动和促进科学数据的集成与共享。按照向上积极采用适宜的国际标准或国家标准,向下突出科学数据共享活动的特点和需求的原则,本标准是在充分参考了国家标准GB/T7027-2002《信息分类和编码的基本原则与方法》和GB/T20001.3-2002《标准编写规则第3部分:信息分类编码》的基础上,结合了科学数据共享活动的特点编制而成的。本标准的附录A是资料性附录本标准为第一次制定。本标准由中华人民共和国科学技术部基础研究司提出。本标准由中华人民共和国科学技术部基础研究司归口。本标准主要起草单位:中国标准化研究院、中国气象局信息中心、中国CDC信息中心、中国农业科学研究院、中国科学院地理研究所和中国水利科学研究院。本标准主要起草人:史立武、王国复、刘丽华、赵瑞雪、李小林、何建邦和朱星明。SDS/T2121-20043数据分类与编码的基本原则与方法1范围本标准规定了对科学数据及其关联数据进行分类与编码应遵循和采用的基本原则与方法。本标准适用于科学数据共享工程各建设单位研究和制定通用和专用的科学数据及其关联数据的分类与编码标准。2规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。GB/T2260-2002中华人民共和国行政区划代码GB/T2659-2000世界各国和地区名称代码GB/T4657-2002中央党政机关、人民团体及其他机构代码GB/T7408-2005数据元和交换格式信息交换日期和时间表示法GB/T10113—2003分类编码通用术语GB11643-1999公民身份号码GB/T13745-1992学科分类与代码3术语和定义本标准采用下列术语和定义。3.1科学数据sciencedata人类在认识世界、改造世界的科技活动中所产生的原始性、基础性数据,以及按照不同需求系统加工的数据产品和相关信息。3.2关联数据relateddata科学数据共享活动涉及的、与科学数据的生产、加工、处理、交换、共享、服务和应用相关联的各种数据,如科学数据的生产者、产地、生产时间等。3.3分类对象objectsofclassification被分类的事物或概念。在本标准中特指科学数据及其关联数据。3.4数据分类dataclassification根据数据的属性或特征,按一定的原则和方法对其进行区分和归类,并建立起一定的分类体系和排列顺序的过程。3.5SDS/T2121-20044线分类法methodoflinearclassification按选定的若干属性(或特征)将分类对象逐次地分为若干层级,每个层级又分为若干类目的分类方法。同一分支的同层级类目之间构成并列关系,不同层级类目之间构成隶属关系。3.6面分类法methodofareaclassification按选定的若干属性(或特征)将分类对象按每一属性(或特征)划分成一组独立的类目,每一组类目构成一个“面”,再按一定顺序将各个“面”平行排列,使用时根据需要将有关“面”中的相应类目按“面”的指定排列顺序组配在一起,形成一个新的复合类目。3.7混合分类法methodofcompositeclassification将线分类法和面分类法组合使用,以其中的一种为主,另一种做补充的分类方法。3.8上位类categoryinhigherlevel在线分类体系中,一个类目相对于由它直接划分出来的下一级类目而言,称为上位类。3.9下位类categoryinlowerlevel在线分类体系中,由上位类直接划分出来的下一级类目。3.10同位类categoryinsamelevel在线分类体系中,由一个类目直接划分出来的下一级各类目。3.11编码对象codedobjects被编码的分类对象。在本标准中特指科学数据及其关联数据。3.12数据编码datacoding将数据赋予具有一定规律、易于计算机和人识别和处理的符号,并形成对应的代码表的过程。3.13代码code给编码对象赋予的一个或一组字符。注:这些字符可以是阿拉伯数字、拉丁字母或便于人和机器识别与处理的其他符号。3
本文标题:科学数据共享工程-数据分类与编码基本原则与方法060214
链接地址:https://www.777doc.com/doc-4338946 .html