您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 基础医学 > 科技文献检索基础知识
第二章科技文献检索基础知识2第一节科技文献检索原理一、文献检索基本概念文献检索就是以文献为检索对象的一种检索。而人们在实际应用过程中,住往把信息检索、文献检索两个概念混同使用,视为同义语。其实信息检索、文献检索是有着一定区别的,信息检索具有更广泛的含义。信息检索是指将信息按一定的方式组织和贮存起来,并根据信息用户的需要找出有关信息的过程。所以,它的全称又叫信息存储与检索。这是广义的信息检索。狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需信息的过程,相当于人们所说的信息查寻。3根据检索对象的不同,信息检索可分为3种:数据检索、事实检索、文献检索。1.数据检索检索结果是数据,例如某种金属的熔点,某种材料的电阻。另外,有关计算公式、数据图表、化学分子式等都属于数据检索范畴。2.事实检索检索结果是事实结论。凡查询某一事物(事件)的性质、定义、原理,以及发生的时间、地点、过程等等,都用于事实检索的范畴诸如某类产品由哪些厂家生产,哪个牌号最好等即属于事实检索。进行事实检索和数据检索的工具主要是有关参考书和工具书。43.文献检索检索结果是文献资料。凡是查找某一课题、某一著者、某一地域、某一机构、某一事物的有关文献的出处和收藏单位等,均属于文献检索的范畴。例如要系统地收集有关“活性聚合反应”的文献,即属于文献检索。因此,信息检索与文献检索是两个不同的概念,它们有着不同的范畴和含义。但是,3种信息检索类型中,文献检索是最主要、最基本的形式,是信息检索中最重要的一部分。文献检索可分为手工式检索(简称手检)和计算机化检索,(简称机检)。手检是基础,机检是发展方向。5二、文献检索原理由于科技文献快速增长和内容高度分散,这给文献检索和利用带来了越来越多的困难。采用传统的浏览来直接获取文献,已不能满足需要。人们需要采用科学的方法,来获取所需文献,编制文献检索工具(存储文献)和利用文献检索工具(检索文献)。文献检索包括对文献的加工整序(存储)和查寻(检索)两部分,其检索原理简单地说,就是在文献的存储过程中,对每一篇有价值的文献进行分析、著录,以极其简洁的形式加以揭示,赋予特定的标识(如分类号、主题词等),并将某种标识按照一定的检索语言——分类语言、主题语言等集中组织起来,成为有规律的检索系统,即检索工具;检索者在查找所需文献时,只是以该系统所用的标识作为提问标识,与系统中的文献持征标识进行比较,并将文献特征标识与提问标识一致的文献线索从检索系统中检出,检出的部分就是检索的结果。6上面两个过程可用图2-1来表示。7三、检索语言在存储和检索过程中,检索语言起着重要的语言保障作用。它沟通文献存储和检索两过程,沟通标引人员和检索人员双方思路,既是编制检索工具的依据,也是计算机信息存储及检索系统用以表达文献主题概念的人工语言。如果没有检索语言作为标引人员与检索人员的共同语言,就很难使得标引人员对文献主题内容的表达(文献标引)与检索人员对相同内容的课题文献需求(课题标引)取得—致。文献检索也就不可能顺利实现、甚至根本无法实现。目前,世界上有数以千种的检索语言。如《中国图书馆图书分类法》(中图法)、《中国科学院图书馆图书分类法》(科图法)、《杜威十进分类法》、《国际十进分类法》、《汉语主题词法》和《工程标题词表》等,这些都是检索语言的文本,就是检索词表。各种检索语言所采用的分类号或主题词都是检索语言的语词。在一部检索工具中,成千上万的文献著录款目正是根据某种语言编排的,使无序变成有序,一索即得。8检索语言的种类较多,分类方法不一。通常将检索语言分为两大类:表达文献外表特征的语言和表达文献内容特征的语言。图2-2检索语言分类示意图9题名语言是按文献题名字顺逐字排检,西文起首冠词一律不排。著者语言是按著者姓名,按姓前名后的字顺逐字排检。号码语言是按文献代码,如专利号、标准号,报告号、ISBN号、ISSN号等的顺序排检。分类语言是以号码为基本字符,用分类号来表达各种概念,将各种概念按学科性质进行分类和系统排列。主题语言是用语词来表达各种概念,即用自然语言中的名词、名词性词组或句子作为主题词,来表达各种概念,将各种概念不管其相互关系,完全按字顺排列。10检索语言的种类繁多,目前应用较多的是分类语言和主题语言。1.分类语言分类法产生得最早、用得最多的是图书分类法。图书分类法也叫图书分类表,就是按照图书的内容、形式、体裁和读者用途等,在一定的哲学思想指导下,运用知识分类的原理,采用逻辑方法(层次型或树型)编制出来的。例如我国的《中图法》和《科图法》。下面介绍几种常见的图书分类法11(1)中国图书馆图书分类法——简称中图法1973年编成试用本,1975年出第1版,1982年出第2版,1990年出第3版,1999年出第4版,并更名为《中国图书馆分类法》。它是我国图书情报界为实现全国文献资料统一分类编目而编制的一部大型分类法,广泛用于各类型图书馆。现以第4版为例,进行介绍。①编制说明:主要介绍分类法的编制过程,所依据的编制原则、部类及大类的设置和次序的理由,对各种分类问题的处理方法、标记方法、使用方法等。②类目表:它是分类法的中心部分,包括主表和附表,主表包括基本部类、基本大类、简表、详表。基本部类分为:马克思主义、列宁主义、毛泽东思想;哲学;社会科学;自然科学;综合性图书。基本大类是对基本部类的进一步划分,组成22个基本大类(一级类目)。每一大类下根据学科的具体内容层层细分为二级、三级、四级、……类目,这样逐级划分下大就形成了等级分明的科学系统(其结构见图2—3)。③标记符号:《中图法》标记符号采用的是拉丁字母和阿拉伯数字混合编排形式。拉丁字母代表基本大类,其余二级、三级、四级……类目都用阿拉伯数字细分,数字编号采用小数制。12图2-3中图法分类表13(2)中国科学院图书馆图书分类法——简称科图法,1958年出第1版,1974年出策2版,最新版本是1994年出的第3版。总体结构分为5大部类,下分25个大类。不同于中图法的是标记符号采用的是纯阿拉伯数字。科图法以对自然科学分类见长,广泛用于中科院系统各分院、研究所,各部属研究所,各企业及部分高等院校等。下面是科图法的25个基本大类及7l技术科学类下的有关类目(其结构见图2-4)。14图2-4科图法25个基本大类和71技术科学下12个类目15(3)国际十进分类法——UDC(UnversalDecimalClass—ification,简称UDC)由比利时学者鲍成尔·奥特勒(PaulOtlel)和亨利.拉芳(Henrila)在杜威法的基础上扩充而成的UDC分类法,初版于1905年,现已出第3版。这是一种组配式的体系分类法,现有23种文本,被称为世界图书信息的国际交流语言。其主表(大类类目表)把知识分为10大门类,详表(全部类目)有近20万个类目,是各种分类法中类目最详尽的一种。UDC的标识体系由等级分明的阿拉伯数字结合多种辅助符号构成。其可组配的特点如:669.1是黑色金属生产,543是化学分析,则钢铁分析就是669.1‘543。这样将派生出几乎无穷的类目,远远不止20万条了。16(4)《杜威十进分类法》(DeweyDecimalClassification)简称DDC或DC,由美国图书馆学家杜威(MelvilDewey)创制,是目前全世界使用最广泛、影响最大的图书资料分类法,至少有135个国家和地区的20多万个图书馆在采用。《杜威法》第一次发表于1876年,书名原为《图书馆编目排架用分类法及主题索引》。1885年出版第二版,更名为《十进图书分类法及相关索引》到1996年已出版第2l版,除详本之外还有简本。受英国科学家培根的知识分类影响,杜威法将所有的学科归纳成9大类,把涉及全部知识而不能归入任何一门学科的图书总为第0类,称总论,序列在其他学科知识之首。一级大类之下,以圆点相隔再分小类,称子类。每个一级大类再分为10个子类(也有不足或超过的)依此类分下去,形成一个完整的层层展开的等级体系。下面是杜威法的十个大类:17图2-5杜威十进分类法图表18600类之下又分为:600技术或应用科学610医学620工程学630农业640家政650管理与辅助服务660化学工业670制造业680各用途产品制造690建筑工程在620类目之下,又分为许多小类目620工程学621应用物理学621.1蒸汽工程621.2水力工程621.3电力工程192.主题语言主题语言是一种选自自然语言(规范化或未规范化)直接性的检索语言,使用词语标识主题语言实际上是相对于分类语言而言的一切以主题字顺体系为基本结构的检索语言总称。按选词方式分标题词、单元词、关键词及叙词四种。(1)标题词语言它是在分类语言的基础发展起来的。分类语言用代码标识符号代表文献学科主题内容,使用起来不直接。为了克服这一缺点,标题词语言直接用规范化语词对文献主题内容的概念进行标引,使检索者和存储标引人员一目了然,现常用的标题词语言有美国《EI》的《SHE》和美国《CA》的《SIG》。20(2)单元词语言它是在标题词语言的基础上发展起来的。标题词语言的语词受标题词表严格限制,在科技迅猛发展的今天,无论词表编制者如何有远见,所列语词总不能完全反映最新科技成果。所以单元词语言就采用单元词通过组配(字面)来表达文献的主题概念。(3)叙词语言单元词语言以单元词字面组配表达文献内容的主题概念,标引深度高。但由于是字面组配,常出现虚假组配导致误检。为了克服单元词不能反映各单元词的概念关系,叙词语言应运而生。叙词语言是采用概念组配的原理,对文献主题要领进行标引。比如“彩虹电器”的标引。现常用的叙词语言词表有《汉语主题词表》、《INSPEC叙词表》等。21(4)关键词语言标题词语言、单元词语言、叙词语言都是受词表控制的规范化语言。为了便于计算机自动抽词编制一些检索工具的索引,关键词语言被广泛使用。关键词语言是不受词表控制的非规范化语言,由计算机按禁用词表在文献题名中或摘要中排出非关键词和禁用词,如冠词、介词、连词、助词、代词及某些缺乏检索意义的形容词、副词、名词等,将所剩下的词(即关键词)进行自动轮排,形成关键词索引。关键词语言发展很快。现美国《化学题录》主题索引及美国《CA》的期刊主题索引均以关键词语言编制。22第二节科技文献检索工具一、检索工具的定义检索工具是人们用来存储、报道和查找文献的工具。因此,它具有存储和检索的功能。存储是把分散、无序的文献,采用一定的检索语言使其集中,组织起来,成为有规律的检索系统,变成检索工具。检索是人们按照有关检索语言,采用一定的方法和途径,检出自己所需的文献。一般检索工具必须具备4个基本条件:23(1)必须详细著录文献的外部特征和内容特征。所谓外部特征,是指文献篇名、著者姓名、文献序号等,所谓内容特征则是指文献的学科属性、主题内容等。(2)必须具有既定的检索标识。如主题词、分类号、著者姓名、文献序号、文献篇名等。(3)全部文献必须根据标识,系统地、科学地排列,成为一个有机的整体。(4)能够提供多种检索途径。具备上述条件,才能成为检索工具。前3条是对文献存储过程所提出的要求,最后一条则是对文献检索过程所提出的要求。24二、检索工具的作用(1)检索工具能将不同类型、不同语种的文献按学科或主题加以集中、组织在一起,避免了直接检索的分散性、盲目性和偶然性,从而在查全率和查准率两个方面都能保证其检索效率。(2)借助于检索工具检索文献可以缩短检索过程、节省读者的时间。检索者不必去阅读大量分散的各种类型及文种的原始文献。因为检索工具使科技人员在查找文献时所面对的不再是文献的全文,而只是反映原文状况的一些著录事项,因而大大地提高了检索速度。25(3)检索工具中的标识(分类号、主题词等)是按照一定的检索语言来编排的,因此,它可以提供有规律的检素途径,使检索者得以根据需要灵活地从多种角度进行检索。(4)帮助科技人员消除语言文字的障碍。目前世界上出版的科技文献所使用的语言有60一70种之多,科技人员直接查阅文献时、常常受到语种的限制而漏查一些有重要参考价值的文献,而一种检索工具可以用一
本文标题:科技文献检索基础知识
链接地址:https://www.777doc.com/doc-2236463 .html