您好,欢迎访问三七文档
2020/3/111第2章信息检索概论本章要点:信息检索原理信息检索的类型检索语言及检索语言的使用(检索)方法信息检索系统的基本概念信息检索一般步骤常用的信息检索方法附各种书目信息查找途径2020/3/112信息处理人员用户原始信息检索课题检索工具检索结果信息分析、著录和标引课题分析检索语言(主题词/分类号)存储过程检索过程2.1信息检索原理2020/3/1132.2信息检索类型以检索内容区分:文献检索—非确定性检索数据检索—确定性检索事实检索—确定性检索以检索方式区分:手工检索计算机检索2020/3/1142.3检索语言、检索原理、检索方法检索语言分类检索原理与检索方法主题检索原理与检索方法2020/3/1152.3检索语言定义:是用来描述文献的内容特征、外表特征和表达情报提问的一种人工语言。检索语言的基础是概念逻辑。检索语言主要有分类语言、和主题语言两大类。在信息存储与检索过程中起着极其重要的作用。2020/3/1162.3.1检索语言种类按构成原理⑴分类语言:体系分类语言⑵主题语言①叙词语言—概念组配是叙词语言的最主要特征.②关键词语言—不加规范化处理是关键词语言的主要特征.2020/3/1172.3.2分类检索原理与检索方法分类检索原理:⑴分类法(表)的定义:按照文献信息的内容和形式等,根据科学学科之间的逻辑归属关系,采用层次型或树杈型结构,列举人类所有的知识类别,并对每一种知识门类分别标以相对固定的代码,从而形成的类表。⑵常见的国内外通用分类法:《中国图书馆图书分类法》(简称中图法)《杜威十进分类法》(DDC)《国际十进分类法》(UDC)《美国国会图书馆图书分类法》(LCC)2020/3/118附:中图法中图法大类:A马克思主义、列宁主义、毛泽东思想B哲学C社会科学总论D政治、法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理2020/3/119接上页:N自然科学总论O数理科学和化学P天文学、地球科学R药学、卫生S农业科学T工业技术U交通运输V航空、航天X环境科学、劳动保护科学Z综合性图书2020/3/11102.3.2分类检索原理与检索方法分类检索原理:⑶分类号的组成①《中图法》:由拼音字母与阿拉伯数字组成。如:“英语”的类号为H31.②《科图法》即《中国科学院图书分类法》.由阿拉伯数字组成.如:“英语”类号为41.68.2020/3/11112.3.2分类检索原理与检索方法分类检索方法分析待查课题的主题内容,根据主题内容在类目索引中找到相应的类目,在分类表中提取分类号。在相应的检索工具中用分类号检索所需的文献,再根据所需要的文摘提供的出处查找原文。通过分类表或分类目录确定课题的分类号,是分类途径查找文献的关键。2020/3/1112课题的一般分类方法1.单概念课题的一般分类方法了解分类表的体系结构,重点掌握大类的分布。在相关的大类中,由大而小,逐步查找最接近于课题要求的类号。注意表中用于帮助确定类号的类目注释和类目指引。2020/3/1113课题的一般分类方法2.多概念课题分类的一般方法凡是有主次者,应取其重点或主要研究对象归类。研究一种理论或方法在某方面应用或对某方面影响的课题,应在所应用或受影响的类目中查找;(计算机技术在文学领域的应用)研究一种理论或方法在多方面应用或对多方面造成影响的课题则在该理论或方法等本身所属的类目中查找。2020/3/11142.3.3主题检索原理与检索方法主题检索原理主题途径是以代表文献主题内容的实质性的词汇作为检索标识进行文献检索的一种检索途径。主题途径查找文献的关键是确定主题语言。目前常用的主题语言是关键词和叙词二种。2020/3/1115关键词语言关键词是指表示文献主题意义的那些由作者使用的名词或词组(包括各种符号)。优点:能较快地反映科技的最新发展。由于无须人工干预,它十分适于计算机编制索引,加快了索引的出版速度,增加了可使用的检索入口词。缺点:使用者难以考虑周全所有可使用的词语,容易造成漏查;过分依赖计算机机械地抽取词汇和排列文献,因而检出的不切题文献的比例较大。2020/3/1116课题的关键词确定方法分析课题,提取概念整理概念,扩充同义词汇运用分析所得词汇试查,确定课题合用的关键词2020/3/1117叙词语言叙词语言是以规范化科学名词为基础的一种主题法检索语言。所谓叙词是从自然语言中优选出来的经过规范化的名词术语。叙词语言的特点:使用规范化的主题词;主题词之间可以自由组配;编有叙词分类索引可以用于从学科的角度确定主题词。2020/3/1118课题叙词的确定方法课题分析进行课题主题分析时,切忌仅依据课题名称确定主题词。查表选词当主题词表中已有和课题概念相同的主题词时,应直接使用该主题词。组配标引适用于多概念主题与复合主题课题的标引。试查定词2020/3/1119附:引文语言利用科学文献之后的参考文献或引用文献编制而成,创刊于1961年的《科学引文索引》(ScienceCitationIndex),可看成是引文语言的成型的标志。它从文献引用关系角度,提供了一种全新的信息检索途径。例《中国科学引文索引》和《中国社会科学引文索引》光盘数据库。2020/3/11202.4信息检索系统的基本概念二次文献(检索工具)的类型目录(Bibliography)是一批相关文献信息的著录集合。以报道文献信息出版和收藏为主要功能的检索工具。2020/3/11212.4信息检索系统的基本概念二次文献(检索工具)的类型题录(Title)是将图书、报刊等文献中论文的篇目按照一定的排检方法编排而成的,供人们查找篇目出处的检索工具。2020/3/11222.4信息检索系统的基本概念二次文献(检索工具)的类型文摘(Abstracts)是以精练的语言把文献信息的重要内容摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。2020/3/11232.4信息检索系统的基本概念二次文献(检索工具)的类型索引(index)是对一组信息集合的系统化的指引,通常依附于其他检索工具。2020/3/11242.5文献信息检索的步骤1.明确检索要求,分析课题涉及的概念明确检索要求就是要搞清楚需要查找的课题属于什么学科,所需情报的文献类型及语种,查找文献的年代,所需文献的最佳篇数,允许支配的检索费用。分析课题所涉及的主要概念,找出能代表这些概念的若干个词或词组,这些词或词组将作为检索词在检索中使用。2020/3/11252.5文献信息检索的步骤2.选择检索系统根据检索课题的主题及学科范围选择对口的检索系统(检索刊物或者检索数据库)。2020/3/11262.5文献信息检索的步骤3.确定检索途径和检索策略检索途径的选择。常见的文献检索途径主要有反映内容特征的分类、主题两个途径和反映外表特征的著者、号码、引文三个途径。检索策略的确定。所谓检索策略就是检索前制定的概念组配和执行顺序的方案。2020/3/11272.5文献信息检索的步骤4.实施检索以及调整检索策略5.获取原文(三步)首先,根据已知信息中的特征词,判断文献的出版类型。其次,整理文献出处(将文献出处中有缩写语、有音译刊名的还原成全称或原刊名)并从中提取查找馆藏的检索词(项),比如期刊刊名、图书书名、图书编者等;2020/3/1128接上页再次,根据出版类型和提取的检索项在图书馆或情报所查找相应的印刷型馆藏目录、联合目录或公共联机图书目录(OPAC),确定馆藏,最终索取原文。2020/3/11292.6常用信息检索方法按照检索工具使用与否区分有:直接检索法—直接从报刊杂志中通过浏览的方法从中获取所需信息的一种方法。间接检索法—通过检索工具的指引进行查找,获取所需信息的一种方法。间接法又有追溯法、常用法、综合法之分。2020/3/1130按照所使用的检索工具区分有:追溯法—追溯法是从已有的文献后面所附的参考文献入手,逐一追查原文,再从这些原文后面所列的参考文献逐一追查,不断扩大检索的线索,从而获得一批相关文献信息的查找方法.常用法—它是利用目录、题录、文摘或数据库等各种检索工具来查找文献的方法,也称工具法.综合法—综合法因综合使用追溯法和常用法两种方法而得名,也称循环或交替法2020/3/11312.6印刷型图书出版信息《全国总书目》《中国国家书目》《全国新书目》等2020/3/11322.6网上图书馆藏信息中文书目:全国高校文献信息保障系统(CALIS)的联合书目数据库:()西文书目:美国OCLC系统的WorldCat书目数据库。使用图书馆的OPAC系统等等。2020/3/11332.6期刊馆藏信息《中国科技期刊联合目录》《高校系统订购国外原版期刊联合目录》中国科学院文献信息中心编辑的《全国中西日俄期刊联合目录数据库》《华东地区外国和港台科技期刊预订联合目录》()图书馆的OPAC系统等2020/3/11342.6会议馆藏信息《1976-1978年西文科技会议录联合目录》《西文科技学术会议录联合目录(续编)》图书馆的OPAC系统2020/3/1135小结二次文献查到的内容只是线索而已,还要根据其线索转查原文才能得到检索的最终结果。
本文标题:计算机信息检索2
链接地址:https://www.777doc.com/doc-4303466 .html