您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 数据通信与网络 > 第二三章信息检索的基本方法和基本技术中文检索工具
第二章信息检索的基本方法和基本技术第一节现代信息检索的概念与类型一、信息检索概念信息检索(广义):是从任何信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。它包括存储与检索两个方面。信息检索(狭义):即从检索工具和检索系统中查找出所需信息的过程。二、现代信息检索的类型1、按存储和检索内容划分(1)文献信息检索即查找出用户所需文献线索或原文的检索。其检索结果是文献信息。如查找某一研究课题一定年限内的有关文献,或对一项发明创造进行文献查新等。(2)数据信息检索是指查找出用户所需特定数据、公式或图表形式的检索。其检索结果是数据信息。如查找某一数据、公式、图表、价格,某种物质的化学分子式,某种设备的型号与参数等。数据检索是一种确定性检索。(3)事实信息检索是指以特定的事实作为检索对象的一种信息检索。其检索结果是基本事实。如某个人或某个组织的基本情况,某一件事发生的时间、地点、过程等。文献、事实、数据检索关系图2、按信息组织方式划分(1)全文检索是指检索系统中存储的是整篇文章或整本书。检索时,用户可以根据自己的需要从中获取有关的文章、段、句、节等信息,还可以进行各种频率统计和内容分析。(2)超文本检索是指信息在系统中的组织方式不同而言的。从组织结构上看,超文本的基本组织元素是节点和节点间的逻辑联接链。与传统文本的线性顺序不同,超文本检索强调中心节点之间的语义联接结构。其检索模式是“哪里”到“什么”。(3)超媒体检索是对超文本检索的补充。其存储对象超出了文本范畴,融入了静、动态图像(形)以及声音等多种媒体信息。信息的存储结构从单维发展到多维,存储空间范围在不断扩大。3、按使用不同的工具和手段划分(1)手工检索是指人们通过手工的方式来存储和检索信息,其使用的检索工具主要是书本式、卡片式的信息系统,如目录、索引、文摘等。(2)计算机检索是指人们在计算机检索网络或终端上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需要的信息的过程,其检索是在人机的协同作用下完成的。第三节现代信息检索语言、工具及检索工具的编排结构一、信息检索语言1、信息检索语言概念:应文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。分为规范化语言和非规范化语言(自然语言)两类。2、信息检索语言主要作用:(略)3、信息检索语言的类型按照标识的性质与原理划分:(1)分类语言——是以数字、字母(即分类号)或字母与数字结合作为基本字符,采用字符直接连接并以圆点(或其他符号)作为分隔符的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。分类表基本结构:正表、附表、说明、索引组成。其中正表是主要部分,它由类号、类名、注释三部分组成。如:《中图法》正表之一项为:TP24机器人技术机器人工程学入此。机器人语言入TP31图书馆分类法简介图书分类法是在一定的哲学思想指导下,运用知识分类的原理,结合图书的特点,采用逻辑方法编制出来的对图书文献进行分类的体系分类表。图书分类法是图书分类的依据,是组织藏书的工具。目前我国图书情报单位常用的分类法主要有《中国图书馆分类法》(简称《中图法》)、《中国科学院图书馆图书分类法》、(简称《科图法》)及《中国人民大学图书馆图书分类法》(简称《人大法》)等。《中图法》分类法简介《中国图书馆分类法》(简称《中图法》)是我国图书情报部门通行的分类方法,也是许多国内检索刊物用以组织文献的主要分类法。这个分类法1971年由北京图书馆、中国科技情报所等单位编制的。目前使用的是第四版。“中图法”的体系结构是以科学分类为基础,结合图书文献的特点进行划分,遵循从总到分,从一般到具体,从理论到应用,从简单到复杂,全表共划分为五大部类,往下展开成22个大类。在每一大类下再层层展开为二级、三级、四级……类目,形成一个等级列举式的分类体系。在“中图法”这样层层细分的分类体系中,处于被区分的类称为上位类,相应地说,区分出来的类就是下位类。“中图法”总共设置了53811个类目。《中图法》由编制说明、类目表、标记符号、说明和注释、索引五个部分组成。类目表是整个《中图法》的主体,是类分图书的依据。它由5个基本部类、22个基本大类、简表、详表和复分表五个部分组成。如下表所示:一、马克思主义、列宁主义、毛泽东思想............A马克思主义、列宁主义、毛泽东思想二、哲学..................B哲学三、社会科学...............C社会科学总论D政治E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理四、自然科学.............N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学T工业技术U交通运输V航空、宇宙飞行X环境科学五、综合性图书...................Z综合性图书“中图法”的类目配号采用汉语拼音和阿拉伯数字相结合的混合号码制,即一个字母标识表示一个大类,以字母的顺序反映大类的序列,在字母后用数字表示大类下的类目划分。如I247.57为适应“工业技术”领域中的图书文献分类的需要,对其下一级类目的复分,也采用了字母标志,即工业技术(T)类下细分了16个二级类目(采用双字母标识)。T工业技术TB一般工业技术TL原子能技术TD矿业工程TM电工技术TE石油、天然气工业TN无线电电子学、电讯技术TF冶金工业TP自动化技术、计算机TG金属学、金属工艺TQ化学工业TH机械、仪表TS轻工业、手工业TJ武器工业TU建筑科学TK动力工程TV水利工程(2)主题语言是以自然语言的字符为字符,以名词术语为基本词汇,用一组名词术语作为检索标识的一类检索检索语言。分为标题词、元词、叙词和关键词。(3)代码语言是指对事物的某方面特征,用某种代码系统来表示和排列事物概念,从而提供检索的检索语言。如化学分子式。按照表达文献的特征划分:(1)表达文献外部特征的检索语言——题名、责任者、文献编号等。(2)表达文献内容特征的检索语言——分类语言、主题语言、代码语言三大类型。文献的外表特征与文献是一一对应的,而文献的内容特征与文献却是一种模糊的对应关系。二、信息检索工具检索工具是指用于报道、存储和查找文献信息资源线索的工具和设备的总称,是以一次文献为基础,在广泛收集并经过严格筛选后,对其进行描述、标引或汇集,充分揭示其物质外部特征和内容特征,并按一定的规则组织而成的。(一)检索工具的特点丰富的文献记录。检索工具收录的文献信息量大,学科知识全面、系统,专业性强。必要的检索标识。检索工具能提供各种检索标识,如学科分类号、主题词、著者名称、汉语拼音等。多途经的检索手段。检索工具能提供多样化的检索途径和检索方法,如分类索引、主题索引、著者索引和专门索引等。(二)检索工具的基本类型1、按检索手段,可分为手工检索工具、机械检索工具和计算机检索工具。2、按出版形式,可分为印刷型、缩微型和电子型。3、按著录方式,可分为目录型、题录型(索引型)文摘型和索引型。4、按收录范围,可分为综合性检索工具、专科性检索工具。5、按其载体形式,可分为书本式工具书、卡片检索工具、机读型检索工具及缩微型检索工具。三、信息检索方法和途径(一)信息检索的方法所谓信息检索的方法,即查找文献信息的方法。信息检索的方法往往与文献信息检索的课题、性质和所检索的文献类型有关。归纳起来一般有以下几种。如图所示:检索方法直接法追溯法综合法顺查法倒查法抽查法1、直接法直接法又称为工具法或常用法,是直接利用文献信息检索工具来查找文献的方法。其常用方法分为顺查法、倒查法和抽查法。(1)顺查法是以研究课题所要求的起始年代为起点,由远及近,利用信息检索工具逐年进行查找的信息检索方法。检索的时间跨度一般规定为10年,检索范围要根据研究课题的具体情况而定。这种方法的特点是文献的查全率高,但费时、工作量大。(2)倒查法与顺查法相反,是由近及远逐年进行查找的信息检索方法。这种方法检索效率较高,省时省力,但查全率相对来说不如顺查法。(3)抽查法这是一种针对研究课题发展的特点,抓住学科发展迅速、发表文献较多的年代进行查找的方法。此种方法花费时间较少,却能获得较多文献,但使用抽查法要求检索者必须熟悉学科的发展情况,熟悉学科文献较为集中的时间范围,以便正确地选择抽查的时间跨度。2、追溯法追溯法又称回溯法,是利用文献末尾所附的参考文献线索,进行追溯查找的方法,这是一种传统的获取文献信息的方法,是在没有检索工具或检索工具不全的情况下使用的一种方法,这种方法查找的文献不全。3、综合法综合法又称为分段法或交替法,是顺查法、倒查法、抽查法与追溯法交替使用的一种方法。这种方法既利用检索工具检索文献,又利用文献后边的参考文献进行追溯,两种方法交替使用,直到结果满意为止。(二)信息检索的途径1、分类途径2、主题途径3、著者途径4、其它途径四、信息检索的程序信息检索一般可按照下面程序来进行检索。如图所示:分析研究检索课题选择检索工具确定检索途径和标识索取原始文献掌握获取原文的线索确定检索方法构建检索表达式检索并调整检索策略1、分析研究信息检索课题(1)明确信息检索课题所涉及的学科范围。(2)明确所需信息的类型,包括文献媒体、出版类型、所需文献量、年代范围、涉及的语种、有关著者、机构等。(3)明确信息检索课题对查新、查准和查全的指标要求。2、选择信息检索工具选择恰当的检索工具,是成功实施检索的关键。选择检索工具一定要根据待查项目的内容、性质来确定。选择的检索工具要注意其所报道的学科专业范围、所包括的语种及其所收录的文献类型等。在选择中,要以专业性检索工具为主,再通过综合型检索工具相配合。3、确定信息检索途径和标识一般来说,每种信息检索工具都为检索者提供多条检索途径,归纳起来主要有分类途径、主题途径、题名途径等。(1)分类检索途径。是按文献所属的学科类别来检索文献的途径。主要运用于检索课题要求的是泛指性较强的文献信息。(2)主题检索途径。是从文献的主题概念出发,按确定的主题词来检索文献的一种途径。(3)题名检索途径。是根据文献名称来检索文献的途径。文献题名主要指书名、刊名、篇名等。(4)著者检索途径。是通过已知著者(个人著者、团体著者)的名称来检索文献的途径。(5)号码检索途径。是通过已知号码(专利号、标准号、报告号)来检索文献的途径。(6)其它检索途径。在检索某些学科或专业的文献时,有一些特殊的检索途径。如美国《化学文摘》中有分子式索引,从分子式入手来查找有关文献。4、确定信息检索方法检索方法的选择可根据课题性质、检索的对象、检索的范围和实际可能,确定某个具体课题的检索方法,如采用直接法、追溯法、综合法等。5、构建检索表达式检索表达式是计算机检索中用来表达用户提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符、截词符以及系统规定的其他组配连接符号组成,是检索策略的具体体现。6、检索并调整检索策略通过检索表达式对检出的检索结果进行分析,分析检索结果是否与检索要求一致,不时要修改检索词和检索表达式,直到得到满意的结果。7、掌握获取原文的线索在获取信息线索时要仔细阅读,判断所检出的信息是否符合检索的要求,不仅看篇名,还要阅读整个著录格式,进行综合分析。8、索取原始文献索取原始文献是信息检索的最后一步,根据出版类型在图书馆或情报机构查找馆藏目录或联合目录确定馆藏。原则上说,应该按“由近及远”的顺序逐步扩大查找馆藏目录或联合目录确定馆藏;也尽可能多渠道、多方式地获取原文,如利用与国外图书馆的馆际互借,大型国际联机信息检索系统的联机订购,Internet上的电子邮件和下载服务,或者与出版商直接联系等。五、手工、机械和计算机信息检索简介1、手工信息检索手工信息检索工具的检索方法,从编制的角度,是指使内容有序化的编排方法;从使用者的角度,是指查考内容的检索方法。目前比较常用的方法有形序排检法、音序排检法、分类排检法、主题排检法、时序排检法和地序排检法等。(1)形序排检法。将检索
本文标题:第二三章信息检索的基本方法和基本技术中文检索工具
链接地址:https://www.777doc.com/doc-48380 .html