您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 基础医学 > 文献信息标引(下)第一章
计算机与信息科学学院信息组织中的主题法信息组织是建立信息系统,进行信息管理的必要环节。在信息组织中,需要综合采用多种方法,其中,分类法和主题法是信息组织最主要的两类方法。分类法与主题法在信息检索系统中、在揭示馆藏文献中、在文献实体组织和统计等工作中及其在文献出版发行中都发挥着重要的作用。分类法和主题法在信息组织活动中发挥着重要作用,有很多共同之处,也有很多不同。在前面的一个学期,我们主要学习了分类法的使用,在这个学期,我们将学习主题法的使用。计算机与信息科学学院第1章主题法概述基本概念主题法词汇控制叙词语言计算机与信息科学学院基本概念1.什么是主题法?狭义:主题检索语言,是经过规范的自然语言语词表达文献信息内容属性的人工语言。广义:包括主题检索意义,同时用主题检索语言表达文献信息的内容属性,组织检索系统、检索工具,以提供主题检索途径的方法,也就是用主题检索语言进行标引的方法。计算机与信息科学学院2.文献信息标引是指分析文献信息的内容属性(特征)及相关外表属性,并用特定语言表达分析出的属性或特征,从而赋予文献信息检索标志的过程。计算机与信息科学学院3.主题标引是指对文献信息进行主题分析,用主题检索语言表达分析出的主题,赋予文献信息主题检索标志的过程。计算机与信息科学学院4.主题直接概括文献信息中有参考和检索价值的内容单元的概念,它重点指向内容单元所论及的核心事物或论题。计算机与信息科学学院是用于描述、存储、查找文献信息主题的受控词汇,是主题检索语言的基本单元。5.主题词计算机与信息科学学院是把主题词按一定方式组织与展示的词汇表。6.主题词表主题词表的作用体现在两个方面。从结构看,它按照信息检索查全、查准的要求,通过显示概念间的关系,去组织展示主题词,作为标引、存储和查检文献信息的依据。从功能看,它对所有主题词进行词形、词义、词间关系等方面的控制,从而在文献标引和检索之间搭起了一座桥梁,使二者有了共同的语言。计算机与信息科学学院主题法也称主题检索语言,是以自然语言的语词为字符,以规范化或未经规范化的名词术语为基本词汇,以概念之间的形式逻辑作为语法和构词法,用语词字顺排列,主题概念以参照系统显示概念之间关系的一类检索语言。主题词表;主题整序法计算机与信息科学学院主题法概述主题法类型主题法特征主题法作用主题法理论基础主题法与分类法计算机与信息科学学院主题法的类型构成原理依标识的组配特点依学科、专业的划分范围依所用自然语言语种数量依使用前是否进行控制划分计算机与信息科学学院主题法的特征以实物为中心集中文献信息直接以自然语言的语词作为检索标识以字顺作为排检的主要依据用参照系统等方式揭示主题词之间的关系计算机与信息科学学院主题法的作用揭示信息内容建立信息检索工具或检索系统计算机与信息科学学院主题语言的理论基础主题语言的概念逻辑基础术语学基础知识分类基础系统科学基础计算机与信息科学学院主题法与分类法它们的共同之处主要是:两者都是为揭示文献信息内容;都需要对文献信息进行主题分析;一般都使用预先编制的专门语言工具;赋予的检索标志都是对文献信息主题概念的表达;分类法与主题法之间的差异:表达主题概念的标识形式及特点不同;标识揭示文献信息内容、组织文献信息的角度不同;标引方法有所不同;作用不同。计算机与信息科学学院词汇控制词汇控制的定义词汇控制的原则词汇控制的范围句法控制计算机与信息科学学院1.什么是词汇控制?所谓词汇控制,就是一种把自然语言加工成信息检索语言的信息控制过程。它包括两个方面:一是对自然语言的语词进行压缩、优选和规范化处理;二是对自然语言进行结构化处理。计算机与信息科学学院2.词汇控制的原则正确性单义性系统性简明性成族性兼容性计算机与信息科学学院3.词汇控制的范围词量控制词类控制词形控制词义控制词间关系控制专指度控制先组度控制句法控制计算机与信息科学学院4.句法控制所谓句法控制,就是根据主题标引和检索的需要,通过一定的组词造句的规则,对主题词的组合方式做出规定。主题词通过组配方式表达文献主题的形成的词语组合,称为检索语句。检索语句中主题词之间形成的关系,称为句法关系。计算机与信息科学学院句法控制意义引用次序控制符号句式轮排计算机与信息科学学院(1)句法控制的意义在主题法中进行严格的句法控制,是正确、一致地标引和检索文献信息的需要。计算机与信息科学学院(2)引用次序引用次序也称为组配次序,是指对复合主题进行标引和检索时,各个主题因素的组合或排列的次序。计算机与信息科学学院①显著性引用次序显著性引用次序是根据主题概念对用户心理映象的显著程度确定的次序。克特:将更加显著的语词放在最前面凯赛:实体——过程柯茨:事物—部件—材料—活动—施动者计算机与信息科学学院②范畴职能引用次序范畴职能引用次序是指将各种主题概念划分为范畴,并按范畴的性质、职能确定组配顺序。阮岗那赞:范畴分面公式(PMEST)本体—物质—动力—空间—时间(具体性递减的原则)维克利:标准引用次序(从理论原则和范畴设置两个方面对阮岗那赞引用次序进行改进)物质(产品)—种类—部分—成分—性质—过程—操作—施动者或工具(目的性原则)计算机与信息科学学院③上下文从属引用次序上下文从属引用次序是一种接近自然语言句法手段和语序的引用次序。这一引用次序是随着索引编制自动化的发展逐步建立的。上下文从属原则,也称为语境原则,是根据复合主题中各个主题因素的关系,按从宽到窄的次序予以排列。为了保证主题标引结果能正确显示上下文从属原则,奥斯汀精心设计了一个职能号表。计算机与信息科学学院④中文引用次序刘湘生提出的主题分面组配公式:主体因素—通用因素—位置因素—时间因素—文献类型因素主体因素(对象—方面—方法—结果—条件)张琪玉对主题构成及其层次的分析研究(见图1)计算机与信息科学学院⑶控制符号控制符号,是主题语言根据句法控制需要设计的一整套辅助符号。它是主题语言揭示主题词之间关系意义,进行有效检索的重要句法手段。计算机与信息科学学院①联系符号联系符号也称为联号,是一种用以揭示同一文献中不同主题概念之间联系强度的专用符号。它是后组式检索系统中用于防止主题词之间错误组配的重要句法手段。联系符号主要用于揭示多主题文献中同一主题不同语词之间的联系。单主题文献一般不使用联号。联号的作用主要用于揭示主题词之间的联系强度,和不同主题间的联结性质上的差异。计算机与信息科学学院②职能符号职能符号也称职号,是一种表示主题词在组配中的句法职能的辅助符号。使用职能符号一般应根据主题语言的组配特点和需要,预先确定相应句法范畴和职能号表。除了使用辅助符号作职号外,主题语言也可以用副标题代替职号。职号较多使用于一些特殊的学科领域,如化学、核工业、医学等专业部门。计算机与信息科学学院加权是按照主题词在一文献或检索程序中的重要性,采用赋予一定权值的方式来确定其标引或检索价值的方法,是一种可以在充分揭示文献主题的同时,剔除那些与文献中心主题关系不大、论述较为肤浅的资料的造句手段。③加权计算机与信息科学学院加权标引:是根据各个主题因素在文献中的重要程度,在标主题词的同时赋予相应权值。加权标引通常应预先规定取值方法。加权检索:是指在加权标引的基础上,结合主题词的权值进行查找。加全检索还可以通过权值计算,使用阈值的策略进行查找。③加权加权作为一种句法手段,更适应于机检。计算机与信息科学学院(4)句式轮换——轮排所谓轮排,是将检索语句中每一个有检索意义的语词轮流在排检位置上出现,并对其他主题词作出相应编辑处理的方法。采用句式轮换,可以通过对语词位置的调换,使每一个具有检索意义的语词都有机会成为检索入口,从而可以从不同角度检出该内容的全部文献。计算机与信息科学学院轮排技术主要用在计算机辅助编制的索引之中。(4)句式轮换——轮排主题词轮排方法:简单轮排;词对轮排;转动轮排;结构轮排。计算机与信息科学学院叙词语言叙词语言是一种较新型的主题标引语言,他综合了在其之前产生和发展的各种标引语言的优点,能较好的适应自动化检索系统和检索方法的需要,已经成为当代主要的标引语言,在信息组织和检索中发挥着重要作用。计算机与信息科学学院叙词语言概念叙词语言原理的综合性叙词语言的词汇控制叙词表的结构叙词表的编制、管理和评价计算机与信息科学学院叙词语言:概念叙词语言的概念:是以从自然语言中精选出来的,经过严格处理的语词作为文献主题标识,通过概念组配方式表达文献主题的主题法类型。叙词:亦称主题词,是指经过规范化处理的,以基本概念为基础的表达文献主题的词或词组。(注:元词是字面上不能再分的语词。)计算机与信息科学学院叙词语言原理的综合性叙词语言对单元词语言的扬弃叙词语言对其他标引语言原理方法的吸收概念组配是叙词语言最基本的原理叙词语言的特点计算机与信息科学学院1.叙词语言对单元词语言的扬弃①叙词语言继承了单元词语言的语词标识后组方式。但是抛弃了单元词语言的字面组配原则,采用了概念组配原理。②单元词语言开创了标引语言使用的标识单元方式,并同时适用于手工检索系统和机械检索系统。叙词语言以此为基础,发展成为,即适用于标识单元方式(倒排档),又适用于文献单元方式(顺排档);既特别适合于计算机检索系统,又能用于手工检索系统。计算机与信息科学学院1.叙词语言对单元词语言的扬弃③单元词语言较早采用了防止语词标识后组产生歧义的句法控制符号(联系符号和职能符号)。叙词语言在必要的时候,以适当的方式采用了这种方法及其原理,降低了使用上的复杂性。计算机与信息科学学院2.叙词语言对其他标引语言原理方法的吸收①采用了分面组配分类语言的概念组配来取代单元词语言的字面组配;②适当采用标题语言的预先组配,选用必要的词组,放弃单元词语言的标识单元性原则;计算机与信息科学学院2.叙词语言对其他标引语言原理方法的吸收③采用标题语言和单元词语言对语词实行严格控制的方法,以保证概念表达的唯一性。④采用并进一步完善了标题语言的参照系统;计算机与信息科学学院2.叙词语言对其他标引语言原理方法的吸收⑤采用等级列举式分类语言的原理编制叙词分类索引(范畴索引)和等级索引(词族索引),甚至直接引入等级列举式分类表或分面分类表,实现分类主题一体化;⑥采用关键词语言的轮排方法,编制叙词轮排索引。计算机与信息科学学院3.概念组配是叙词语言最基本的原理概念组配与字面组配的区别叙词的概念组配类型叙词组配的作用计算机与信息科学学院(1)概念组配与字面组配的区别•概念组配与字面组配对词汇单位的要求不同;(字面组配强调的是词汇的单元性;概念组配要求词汇单位既能单独表达概念,又能组配表达概念,而且表达的概念应该一致)•概念组配与字面组配的本质不同;(概念组配在概念分析的基础上进行;字面组配利用构词法进行词的分拆与组合)计算机与信息科学学院(2)叙词的概念组配类型①交叉组配使用两个或多个具有交叉关系的同性质叙词相互限定的组配。交叉组配所产生的概念肯定是各个参加组配概念的种概念。例:教育心理学既是教学的种概念,又是心理学的种概念。计算机与信息科学学院②方面组配(限定组配)是指将表示某一事物的叙词与表示事物方面(部分、属性、状态、过程、条件等方面)的叙词进行组配。参与组配的词不是同性质的词,它们所表达的概念,在外延上并不相交。但是,它们所代表的文献信息及其内容集合却又交叉部分。方面组配产生的新概念也是一个专指概念,或称下位概念。但是,它只是其中一个参与组配概念的种概念,与参与组配的另一个概念的关系则是方面与事物、部分与整体、过程与主体等关系种的一种。例:汽车和发动机组配表达汽车发动机,汽车与操纵稳定性组配表达汽车操纵稳定性。计算机与信息科学学院③联结组配这种组配表示两个或多个概念之间或表示两个或多个事物之间的联系,并不形成新的概念。它往往是表达不同事物的叙词之间用表示它们之间关系的叙词联结起来。例:用“图书馆学---关系---情报学”组配表达“图书馆学与情报学的关系”;用“粤语---比较---普通话”组配表达“广东话与普
本文标题:文献信息标引(下)第一章
链接地址:https://www.777doc.com/doc-3650168 .html