您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 国内外标准规范 > gbt15387.2-94
中华人民共和国国家标准术语数据库开发指南11范围本部分规定了术语数据库(简称“术语库”)术语条目的结构、数据库的功能、扩充以及数据规范化的要求。本部分适用于术语库的研究、开发、维护及其管理工作。其他涉及术语数据处理的工作也可参照使用。22规范性引用文件下列文件中的条款通过本部分的引用而成为本部分的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本部分。GB/T3792.1文献著录总则GB/T3860文献叙词标引规则GB/T8566信息技术软件生存期过程GB/T13418文字条目通用排序规则(neqISO7154-83)GB/T13725-xxxx建立术语数据库的一般原则与方法GB/T13726-1992术语与辞书条目和记录交换用磁带格式(neqISO6156-87)GB/T13745学科分类与代码GB/T15387.1-xxxx术语数据库开发文件编制指南GB/T15237术语学基本词汇(eqvISO1087-90)GB/T16786-1997术语工作计算机应用数据类目(eqvISO/DIS12620-1996)GB/T17532-1998术语工作计算机应用词汇(eqvISO/DIS1087-2-2:96)33术语和定义GB/T15237.1-2000、GB/T16786-1997、GB/T17532-1998确立的术语和定义适用于本部分。为了便于使用,本部分重复了其中的部分术语和定义。3.13.1术语term在特定专业领域中一般概念的词语指称。[GB/T15237.1—2000,3.4.3]3.23.2数据库database常期储存在计算机中,有组织、可共享的数据集合。3.33.3术语数据库terminologicaldatabase包含术语数据的数据库。[GB/T17532—1998,7.6]3.43.4记录record作为一个单位来对待的数据元的集合。[GB/T17532-1998,7.9]3.53.5数据元dataelement在一定的上下文中具有区别特征的数据单元。[GB/T17532—1998,7.11]3.63.6数据字段datafield为特定的数据元而保存在一个记录中的变长或定长的部分。[GB/T17532—1998,7.12]3.73.7数据类目datacategory数据元类型dataelementtype关于给定数据字段的类型说明。[GB/T17532—1998,7.14]3.83.8标识符identifier用于标识或命名一个数据类目的一个或多个字符[GB/T17532—1998,7.15]3.93.9术语条目terminologicalentry术语数据集合中所包含的关于一个概念的术语数据。[GB/T17532—1998,3.22]44术语条目结构在术语库中,根据不同的使用目的,每一条术语及其相关的一组数据元构成一个术语单位。每一数据元占用一个字段(或子字段),具有相同属性的一类数据元构成一个数据字段。4.14.1字段数目应根据术语库应用的需求确定字段数目,既要按照规范化的要求,最大程度地满足用户需要,又要避免浪费。4.24.2字段名称应使用易记、易识别的字符串。例1:字段名称:序号(xuhao/number)缩写:xh(汉语拼音)或Num(英语)例2:字段名称:定义(dingyi/definition)缩写:dy(汉语拼音)或def(英语缩写)4.34.3字段标识符字段标识符可使用字母或数字,如果使用数字,应符合GB/T13726-1992附录A的要求。字段标识符及其编制原则与方法,应在提供给用户的文件中注明。4.44.4字段数据类型A.1.1.14.4.1字符型可以汉字、字母、数字、特殊符号等。术语、定义等应使用字符型字段。A.1.1.24.4.2数字型可以是整数、小数、正数和负数等。序号应使用数字型字段。A.1.1.34.4.3日期型日期型数据字段结构为:CCYYMMDD。例:20010515表示2001年5月15日。术语源的生成日期(例如标准发布日期,辞书出版日期等)、术语记录的生成日期等应使用日期型字段。A.1.1.44.4.4其他术语数据还可能涉及其他字段数据类型,例如逻辑数据类型等。4.54.5字段长术语库应尽可能使用变长字段,使用定长字段时应考虑使用方便及节约存储空间等因素。4.64.6字段间关系根据术语数据元之间关系的特点,字段间的关系可以是一对一(1:1)、一对多(1:N)或多对多关系(M:N)。4.74.7字段的强制级别字段的强制级别应根据该术语库的工作目的而确定。A.1.1.54.7.1必选字段当术语数据类目是构成术语条目所必需的最小信息时,使用此类字段。例如,面向概念的术语库中的“术语”“定义”;面向翻译的术语库中的“术语”“外文对应词”等。必选字段必须设立,不允许空缺。A.1.1.64.7.2应选字段当术语数据类目是构成术语条目所必要的信息时,使用此类字段,但允许空缺。例如,面向翻译的术语库中的同义词、术语的缩略形式等。A.1.1.74.7.3可选字段当术语数据类目是构成术语条目的可选信息时,使用此类字段。例如,语法信息、语境等。4.84.8字段的可重复性当属于相同的术语数据类目的术语数据元(如同义词)需要在一个记录中出现几次时,可重复使用同一字段。4.94.9字段的组合性几乎所有术语数据类目的数据元(字段)均可以与一个或若干术语数据类目的数据元(字段)组合,构成一个新的术语条目。4.104.10子字段当确定的某一字段可能存在几个值,或一个字段需反映几项内容时,可使用子字段。a)a)一条术语可能有若干个同义词,可根据使用状态进一步划分子字段,例如首选、许用、拒用。b)b)同义性(程度)字段需划分子字段,例如恒等于(≡)、大于(>)、小于等于(<=)、交叉(×)、近义(≈)、反义(←→)等。4.114.11相互参照不同记录之间(如一条术语参照另一条术语);不同的文件之间(如主文件与倒排文件);不同数据库之间(如图形数据库与文本数据库之间,不同语种数据库之间)均存在相互参照。55术语库的功能5.15.1用户界面应能提供良好的汉字处理环境和友好的用户界面。设计的屏幕应具备以下功能:a)a)人机对话。使用者通过键盘或其他输入设备向机器输入提问或其他有关信息,机器通过显示屏幕或其他输出设备给使用者提供解答、提示或其他有关信息。b)b)选单驱动。应根据需要设置系统管理和用户查询使用的不同选单,应设计一个选单系统为用户显示多重选择,根据需要可设计多级选单。例如:一级选单:主功能选择,例如数据输入、数据维护与更新、数据检索、排序和打印等;二级选单:子功能选择,单项功能中的子项,条件等,例如数据检索功能中的浏览、设定检索式、显示检索结果等;三级选单:需要设计的下一层细化功能选择。c)c)提示功能。例如:出错提示:指示错误的性质和类型,以至于如何改正;拒绝接收提示:指示、告警无效或错误的操作;操作步骤提示。d)d)求助功能。例如:正确操作的具体、详细的说明;有关内容的资料,包括语种代码、学科代码、源机构代码、责任者代码等常用代码及其含义说明;有关屏幕显示内容的解释,参数值的含义与范围,命令或功能选择描述。求助功能可使用窗口技术或调用辅助库、辅助屏予以实现,此状态应易于进入和退出、返回原操作状态。e)e)用户需要的其他功能。例如:浏览、窗口等。5.25.2数据检索术语库除应能检索单一术语及相应信息(定义、外文对应词等)外,还应根据需要设计以下几种类型的检索。a)a)内部属性检索。根据分类语言、叙词语言进行检索。分类语言检索得出的是适合某一分类的某一领域内成体系的全部术语;叙词语言检索出的是某一术语可能涉及的所有术语,包括其他领域内的相关术语。b)b)外部属性检索。例如:按术语源书目编目数据检索出该文献所包含的所有术语;按源机构(或责任者)检索出该机构所编纂(制定)的所有术语;按年代检索出术语编纂的年度变化情况。c)c)组合属性检索。同属性或不同属性的组合检索。检索技术应满足GB/T13725-xxxx中8.2的各项要求。5.35.3查重与数据校验应设计查重功能,数据校验功能应根据GB/T13725-xxxx中8.1.2的要求设计。5.45.4术语库重组与重构a)a)根据需要,设计数据库重组功能,自动的回收已删除记录所占的存储空间,并重新加以利用。b)b)当需要时,可改变存取控制、硬件配置、数据库分布以及修改数据结构等。5.55.5恢复、备份和重新启动应支持术语库的恢复、备份和重新启动。由于误操作、程序出错或其他意外原因(例如掉电)需要重新启动时,使用备份;由于人为或意外原因造成术语库的破坏时,应能:a)a)查明错误的原因;b)b)查明错误的影响;c)c)纠正错误;d)d)纠正后继续工作。5.65.6定义默认值应按照GB/T13725-xxxx中8.1.3的要求,根据需要定义默认值,便于字段内容的自动或半自动生成与修改。5.75.7数值处理应根据需要设计数值处理功能,例如术语和定义的平均长度,某一长度的术语数量及百分比,年术语生成量、使用量、某一用户使用术语库的情况,某一机构编纂术语的情况等。5.85.8排序和打印字顺排序应符合GB/T13418的规定。根据需要设计排序和打印功能以满足下列要求。a)a)应能生成和打印按概念体系排序的术语词汇或词典;b)b)应能生成和打印按外文字母顺序或汉语拼音排序的英—汉、汉—英对照词汇或词典,或其他外语与汉语对照词汇或词典;c)c)应能生成和打印同义(近义)词汇或词典;d)d)应能生成和打印反义词汇或词典;e)e)如果需要,还应能生成语料的有关信息,例如按术语使用频率排序、按术语与其他术语组配频率排序等。f)f)其他功能。5.95.9程序设计语言接口应能提供某种常用程序设计语言的接口,允许使用该程序设计语言编写自己的应用程序,开发某些特殊功能。5.105.10网络支持应能实现网络查询、数据搜索和数据下载等网络应用的基本功能5.115.11其他a)a)数据输入应符合GB/T13725-xxxx中8.1的要求;b)b)数据显示应符合GB/T13725-xxxx中8.3的要求;c)c)数据安全性和保密应符合GB/T13725-xxxx中6.1.7和8.6的要求;d)d)数据传递和数据交换应符合GB/T13725-xxxx中7.7和第10章的要求;66数据规范化6.16.1数据采集应从需要和可能两个方面,并根据GB/T13725-xxxx中7.2.1确定数据采集的要求。A.1.1.86.1.1数据需求a)a)拟收录术语的范围及总数量(可分期安排);b)b)拟使用的语种及使用程度(是仅收录相应语种的外文对应词,还是也收录该术语的定义、同义词等其他数据);c)c)拟确定的数据类目。A.1.1.96.1.2数据保障a)a)术语源的类型,例如标准、百科全书、词典、专业文献等;b)b)术语源的权威性、充足性,例如,多语种的术语库就需要有多语种的文献;c)c)专家构成,包括专业领域的专家、术语学家、语言学家等;d)d)工作人员水平,包括专业水平、外语水平等;e)e)应根据GB/T15387.1-xxxx中5.14~5.16的要求编写数据加工技术规则;f)f)应根据GB/T15387.1-xxxx中5.18的要求编写数据加工工作规程;g)g)应规定数据验收标准和验收方式,包括对各项数据和各加工过程和质量要求、检验方法、依据和程序等。A.1.1.106.1.3数据的采集方法根据6.1.1~6.1.2条确定数据采集原则以后,规定数据采集的统一格式(采集卡片或工作单),根据该统一格式收集、挑选、登录数据。该格式应满足术语库对数据的要求,应与术语库结构一致。6.26.2标引A.1.1.116.2.1分类法为了便于标引工作和国内外术语数据的交换,应尽量采用通用的分类法。例如:a)a)中国标准文献分类法(CCS);b)b)国际标
本文标题:gbt15387.2-94
链接地址:https://www.777doc.com/doc-8759105 .html