您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 2信息组织(主题法)
1、二、信息的控制2、5信息组织的主题方法一、主题法主题法——即主题检索语言。是指以表达主题内容的词语作检索标识,以字顺为检索途径的一种标引和检索信息资源的方法。主题法标题法单元词法叙词法关键词法主题法的特征1、以特定的事物、问题、现象,即以主题为中心集中信息资源;2、以字顺为主要检索途径;3、通过参照系统等方式揭示主题词之间的关系。4、主题法的基础同样是概念逻辑和知识分类,在应用知识分类方面主要是应用事物分类原理。主题法的特点可以集中与主题有关的各个方面的信息资源,检索直接性、通用性好,适合于各种专指检索。在性能上与分类法互补。主题法通常不用于组织图书,只广泛用于组织各种检索工具,不仅可以编制用于手工检索的书目索引,也可以用来建立计算机检索系统,进行机检。先组式语言表达复杂、专深概念的标识基本上预先(一一例举出来)构造好,标识时不需要或基本不需要组配操作的一种检索语言。如:等级体系分类语言(体系分类法)标题词语言(标题法)后组式语言在标引和检索的过程中,为表达复杂、专深的概念,需要将简单、宽泛概念的标识进行组配操作的检索语言,如:组配分类法单元词法叙词法主题检索语言。
2、的特点用自然语言中的名词术语经过规范化后直接作为信息主题标识。用字顺序列排列标识,易于检索。具有按主题集中信息的功能。用参照系统显示信息间的关系,但系统性不如分类语言。较接近自然语言,易与自然语言结合使用。标题词语言属于先组式语言。单元词语言和叙词语言属于后组式语言。关键词语言通常也归入主题检索语言类,但实际上是直接使用自然语言的一种方法,对取自文献的语词几乎不做规范化处理,也不显示主题概念之间的关系,是一种准检索语言。主题法类型按照选择的词汇按照组配先后按照是否控制标题法先组式受控元词法后组式早期为非受控叙词法关键词法后组式或散组式后组式受控非控自第一部标准的标题表《美国国会图书馆标题表》1909年诞生以来,主题描述语言已有近百年的历史。近百年来,主题语言经历了从标题法到元词法、叙词法、关键词法的演变过程。其发展趋势是——从先组式语言向后组式语言发展,从例举式语言向组配式语言发展,从人工操作向自动处理发展,从受控语言向规范化语言与自然语言并用发展。(重点)1、标题法标题法是最早产生的一种主题语言。标题法是用规范化了的自然语言(标题),即经过标准化处理的名词术语。
3、作为标识,按照字顺排列来标引和检索信息所涉及的事物主题的方法。标题词——也称标题,是指经过词汇控制,用来标引文献的词或词组,通常为比较定型的事物名称,如“信息资源”、“信息存储”等。标题的类型带限定词的标题混合标题带说明的标题倒置标题:如化学,有机;化学,无机复分标题:水果—病虫害;音乐—奥地利标题法主要通过参照的方式来揭示标题词之间的联系。早期的参照形式主要有参照、参见参照两种。标题法的性质:直观性(采用列举式词表)受控性(定组式标题结构固定,含义明确)语义关联性(以参照方式对词汇进行控制,揭示标题之间的相关性)标题表的不足1、采用列举方式,往往造成收词量大、专指度不足、修订量大灯问题。2、大量使用定组式标题影响从多因素、多角度检索。标题词选词的原则:具有检索意义适当的专指度通用性和准确性唯一性标题表的结构和作用:标题表的结构编制和使用说明主表副表标题表的作用:1、登陆经过控制的标题(正式标题)和非标题(非正式标题)2、不仅按字顺组织标题、非标题,而且参照系统显示了标题之间以及非标题和标题之间的关系,便于查找和准确选用标题。3、注释和说明提供标引和检索使用标题的方法。4。
4、、体现标题控制的原则,提供标题控制的示范。标题词款目的结构举例:标题ReferenceBooks标识[z711](注:对应标题的分类号)注释UFBibliography-ReferenceBooksBooks,ReferenceBooksLibraries-ReferenceBooksReferenceBooks,English参照BTBibliographyBooksandreading副标题NTBibliography-BestBooksChildren’sReferenceBooks标题法——主题法的开拓者标题法开创了主题法的最初形式,率先探索了词汇控制等一系列方法,如:制定了标题的选择原则规定了标题的形式标题之间关系的揭示标题标引过程的组配方法等。二、元词法信息资源的数量剧增,信息资源主题的日益专指,使标题法作为列举式主题法已经难以满足对信息资源的标引和检索,元词法就是为克服标题法的不足而发展起来的一种主题方法。元词法是以元词作为主题标识,通过字面组配的方式表达信息资源主题的主题法。元词法脱胎于标题法,是对先组式的标题法改进而出现的,是一种后组式语言。目前,元词。
5、法已发展成为叙词法。元词法原理:任何一个复合概念都可以分解为若干单元概念,而每个单元概念只需一个单元词来表示。元词指最小、最基本的词汇单位,在概念上不能再拆分的词,“车床”、“铁路”等。若干元词的组合构成一个专指标识,精确地表达信息主题或检索课题。如:“隔音板”,由“隔音”“板”两个单元词构成,“塑料隔音板”由三个单元词构成。在使用元词的情况下,对复合主题资源的标引和检索是通过元词的组配进行的。如:“经济文献检索”这一主题,即必须通过“经济”、“文献”、“检索”三个单元词进行标引。单元词法的特点:它的标题是后组式的,它的一些优点都是由此决定的。1、词表体积小。早期的元词系统属于自然语言系统,一般不建立词表,直接从文献选词,但随着使用,后期的元词系统也编制相应的词表。2、标引的专指度高。3、便于从不同主题词角度检索。4、适合对专指主题进行标引。元词法的不足1、直接性差。2、不宜于查找基本主题的信息,如“经济”、“化学”。3、采用字面组配方法,当字面分解不一致时造成误差。4、早期的元词法不建立参照系统,无法进行相关信息查询。元词法的主要贡献是在主题法的发展中率先探索了后。
6、组式的检索方法。元词法目前已经被叙词法所取代。三、叙词法叙词法形成于20世纪50年代末,是在吸取元词法、标题法、以及分面组配分类法等知识组织方法优点的基础上发展起来的。1959年叙美国杜邦公司编制了第一部叙词表,其后发展迅速,到目前为止,国外叙词表已超过2000多种,国内超过130多种。叙词是我国70年代引进的意译外来词,叙词(Descriptor),也称描述词、叙述词。它是一些以概念为基础的,经过规范化达到具有组配性能、显示词间语义关系的词和词组。是描述文献资料主题的一种标识符号。叙词语言对其他检索语言技术的吸收其他检索语言技术叙词语言技术体系分类法学科分类等级结构范畴索引词族索引词汇分类表分面分类语言分面组配概念组配词汇分面分类表标题语言元词语言关键词语言先组见参照;参见参照字面组配完全后组反记法轮排技术适当先组用、代、属、分、参照概念组配基本后组倒排挡轮排索1964年,航空工业部情报系统编制了我国建国后第一部标题词型主题词表《航空科技资料主题表》.1971年修订再版,收录正式叙词4330个,非正式叙词99个。1975-1980年,由中国科技情报所和北京图书馆编制的《汉语。
7、主题词表》完成,收词108568个,其中正式叙词91158个,非正式叙词17410个,是我国也是世界上规模最大的叙词表之一。叙词表已成为受控主题语言的主流。我国使用最广泛的是《汉语主题词表》。主题词——分类号对应表分类号——主题词对应表叙词表是将文献、标引人员或用户的自然语言转换成规范语言的一种术语控制工具;它是概括各门或某一学科领域并由语义相关、族性相关的术语组成的可以不断补充的规范化的词表。叙词法是一种用规范化的单元概念标引文献主题的方法,概念的组配可以在标引和检索时任意组配,是后组式检索语言。叙词语言要求一个概念只能用一个词表达。为此,叙词表中进行的人工规范有:选词原则:1、依据标引和检索的实际需要,并考虑学科或专业领域的现状及发展。选定的词语,应是在文献检索中具有一定的使用频率、并能汇集一定文献量的名词术语。对表达新事物、新兴学科、新技术的词汇应根据实际需要,结合其发展情况加以选用。2、选定的语词要概念明确,一词一义,能准确地表达文献主题和检索提问。对于自然语言中的同型异义词、多义词一般不选用。在切实需要时,则应通过限定的方法加以使用。3、语词的选择应符合叙词概念组配的。
8、特点,收词时应收入一定数量的具有造词功能的词和词组。4、选定的词应符合汉语的构词特点,尽量选用便于字面成族的词。词汇规范:1、词义规范:对同义词、准同义词、近义词、不同译名、学名以及俗名等加以规范,只能用一个规范化的词作叙词。2、词类规范:虚词不能做叙词,实词中选名词、动名词做叙词。3、词形规范:包括叙词(正叙与倒叙),简称与全称,书写繁简体、标点符号等。4、组配规范:必须是概念与概念的组配,不能是字面上的组配。5、语义关联:对自然语言里存在的各种语义关系进行辨别,如:同义、属种、交叉、相关关系等,用一系列符号标示出来。叙词语言对语义关系的揭示方法(叙词的语义参照系统)语义参照关系参照项中文符号英文符号作用等同关系用代YDUSEUF从非叙词指引到叙词从叙词指引到非叙词等级关系属分族SFZBTNTTT从下位叙词指引到上位叙词从上位叙词指引到下位叙词从下位叙词指引到最高位叙词。相关关系参CRT从某一叙词指出其相关叙词语义关系(1、等同关系)也称同一关系、用代关系。指叙词与含义相同或相近、可以相互替代的语词之间的关系。揭示等同关系的作用,可以增加检索入口和根据检索系统需要对标引、检索的。
9、专指度进行控制。通常用于同义词或准同义词之间,一般应有参照和反参照.例:全球环境地球环境D地球环境Y全球环境数据处理数据处理系统D数据处理系统Y数据处理2、等级关系:指上位概念叙词与下位概念叙词之间的关系,也称属分关系、族关系。揭示等级关系有助于扩大或缩小查找范围,提高族性检索能力。等级关系主要用于下述三种叙词之间:1、具有种属关系的叙词之间例:电子侦察F电视侦查雷达侦查通信侦查2、用于具有整部关系的叙词之间。整部关系不构成种属关系,但也可以在一定程度上揭示事物之间的联系。(1)地理位置中的整部关系:例:西欧F爱尔兰比利时法国英国……S欧洲(2)人体系统与器官的整部关系例:中枢神经系统F脊髓脑S神经系统(3)组织机构及其分支机构的整部关系例:联合国F国际法院联合国安全理事会联合国大会联合国秘书处…….3、相关关系只在正式主题词之间进行,二者互为参照。揭示相关关系有助于扩大检索范围,进行相关资料的查找。(1)近义相关的叙词之间例:初等教育C儿童教育(2)交叉关系的叙词之间例:对外贸易C国际贸易(3)反对或矛盾关系例:民主C集中(4)因果关系例:科学研究C。
10、科学发明(5)事物与对应工具的叙词之间例:害虫C杀虫剂……相关关系类型很多,很难完整例举。通常只有一词“作为标引词与另一词具有较强的提示作用时”,才作为相关关系处理。叙词表的结构字顺显示(字顺表、专有叙词表、双语种索引)系统显示(范畴索引、词族索引、轮排索引)图形显示字顺表(主表。由众多的叙词款目和非叙词款目按字顺排列)ShengchanZiben——汉语拼音叙词——生产资本[05CD]——范畴号ProductiveCapital——英文对应词代项——D生产资本的循环——非叙词F不变资本固定资本可变资本——下位词流动资本属项——S产业资本——上位词族项——Z资本——下位词参项——C货币资本商品资本——相关词叙词表的不足:对词表的编制和管理的要求高,需花费较多的人力和物力;文献标引须在概念分析的基础上进行,增加了标引的难度。自然语言标引与检索直接使用不经过控制的自然语言中的语词作标识,进行信息资源的标引与检索。20世纪50年代后期美国的卢恩等人首先将计算机用于关键词索引的编制后,各种直接以自然语言为标识的检索系统也随之出现。这种检索系统以各种电子文本为基础,一般不对词汇进行控制,因。
本文标题:2信息组织(主题法)
链接地址:https://www.777doc.com/doc-3971946 .html