您好,欢迎访问三七文档
文献检索课三文献信息检索步骤及技术分析检索课题,明确检索需求选择检索工具或检索系统确定检索途径与检索方法选择合适的检索词构造检索式根据文献线索查找全文评价检索结果,调整检索策略,改善检索结果检索步骤示意图用户明确信息需求选择检索工具和方法确定检索途径和标识拟定检索式检索匹配输出结果用户评价获取信息分析检索课题,明确检索需求目的一:分析检索课题的主题要求。将检索课题分解为多个层次的主题概念,明确用户对查全、查准、查新方面的要求目的二:明确检索课题所要求的各种范围或限定条件。包括要求的文献类型、语种、年代跨度等,以及对检索费用、检索时间等其他方面的要求。选择检索工具或检索系统选择恰当的检索工具和检索系统是成功实施检索的关键步骤。检索工具选择是否恰当、相关程度如何,直接影响检索结果的好坏和检索效率的高低。要熟悉各种检索工具的类型、特点和功用。比如馆藏目录主要用于检索一馆或多馆收藏的文献资料;书目、索引、文摘主要用于文献检索和事实检索。确定检索途径和检索方法一般检索工具都会提供多种检索途径,如主题、分类、著者、题名以及其他途径。检索途径的选择要根据检索需求和目前所掌握的检索条件来确定。如,检索要求泛指性强,所需文献范围较广,则适宜选择分类途径;若检索要求专指性强,则适宜选择主题途径;若事先知道文献著者、题名、分子式、专利号等条件,则可利用著者途径、题名途径、分子式途径、专利号途径等进行检索。根据检索目的、期望的文献数量以及有关主题在学科中的发展状况来选择适当的检索方法。若以查新为目的,则适宜选择逆查法,若要全面检索某个主题的相关资源,则适宜使用顺查法。选择合适的检索词概念的分析:任何一个特定的检索课题,往往都是用若干个概念表达的,将检索课题从不同角度对课题内容进行概念分析,并针对每一个概念,选择尽可能多的检索词。主题概念转化而成的检索词应能准确、完整地表达检索课题的内容。实例:如:检索课题:“土壤环境条件对豆科作物固氮作用的影响”如果就从课题的题目中选择主题词:土壤环境、豆科作物、固氮作用,这显然会造成很大的漏检率。我们应利用自已所学的专业知识对课题进行深入细致的分析,把那些与课题关系密切、能全面、准确表达课题内容实质的词一起作主题词。决定土壤环境条件的温度、湿度、PH值等;豆科作物中的大豆、花生等;固氮作用中起重要作用的根瘤菌、固氮菌等。隐含概念的分析有些课题的实质性内容往往很难从课题的名称上反映出来,有些课题单从字面上选择主题词会失之偏颇。课题的隐含的概念和相关的内容需要从课题所属的专业角度作深入分析,才能够提炼出能够确切反映课题内容的检索概念。如:检索“人造金刚石”方面的文献,其中“人造(manmade)的含义包括有“人工合成(synthetic)在内,单选用“manmade”检索会漏掉许多有用的文献;检索“古代家具设计”的相关文献,古代包括明代、清代、宋代等朝代,不能仅以古代作为检索词。同义词应尽量选全:同一概念的几种表达式同一名词的单数、复数、动名词、过去分词等用截词解决,如:child,children规范称谓、俗称、全称、简称等,如:盘丽鱼俗称七彩神仙鱼充分利用选定主题概念的上位或下位概念,找不到课题对应的主题词时,可采用最近一级的上位词。如:“山核桃产品加工”方面的文章,如果“山核桃加工”没有检索记录的话,就得选“核桃加工”作检索词充分考虑相关的词,如研究三带双锯鱼的生活习性,假如找不到相关的文献,可以查找同属或同种的鱼类的研究资料,借以参考。少用或不用对检索课题意义不大的词一般不选用动词、形容词、禁用词,少用或不用不能表达课题实质的高频词。词义泛指过度大的词:如“展望”——趋势、现状、近况等,“应用”——作用、用途、用法等词义延伸过多的词:如“制造”——制备、生产、加工、工艺等,“提炼”——精炼、提取、萃取、回收,以及诸如“有机物”、“无机物”、“病虫害”等外延十分宽的概念等,一般都应转换成具体的方法或材料、化合物及具体的病害与虫害的名称表示。构造检索式检索提问式是在计算机检索过程中用来表达用户检索提问的逻辑表达式,由检索词和各种连接组配符号按照特定检索系统的语法组配在一起。布尔检索式位置检索式布尔逻辑检索利用布尔逻辑算符将一些具有简单的、表达某一主题概念的检索单元(或检索标识)组配成一个具有复杂概念的检索式,以满足课题检索的要求。主要通过“和(and,*)”、“或(or,+)”、“非(not,-)”等将检索词联络起来。逻辑算符含义表示关系作用及表达“与”(AND或*)检索出的记录必须同时含有所有的检索词概念交叉和限定缩小检索范围,提高查准率AandB或A*B“或”(OR或+)检出的结果中只需满足检索项中的任何一个或同时满足即可并列关系组配相同概念的检索词,如同义词、近义词等。扩大检索范围,提高查全率AorB或A+B“非”(NOT或-)检出的记录中只能含有NOT算符前的检索词,不能同时含有其后的检索词概念删除关系缩小检索范围,提高检索的专指度AnotB或A–B运算优先级顺序为NOT、AND、OR,可以用括号“()”改变它们的运算顺序。如Aand(BorC),检索顺序为先B或C,然后再与A逻辑算符举例查找关于“动物保护”的文献:“动物”和“保护”可以用“逻辑与”组配,表示为“动物AND保护”,检出记录中既涉及动物又涉及保护的相关文献。查找有关冬虫夏草的文献:冬虫夏草又称冬虫草、虫草,“冬虫夏草”、“冬虫草”、“虫草”三者要用逻辑或组配,表示为“冬虫夏草or冬虫草or虫草”,检索出文献中包含三者任意一种即被检出。查找关于国外建筑特色的文章:国外即不包括中国,建筑和中国之间为逻辑非的关系,表示为“建筑not中国”,检索结果排除了中国建筑的相关文献。检索西红柿种植技术的相关文章:西红柿”又称“番茄”,表示为“西红柿+番茄”;“种植”的同义词有“栽培”、“培育”,表示为“种植+栽培+培育”;检索表达式为:(西红柿+番茄)*(种植+栽培+培育)截词算符截词检索主要是利用检索词的词干或不完整的词形进行检索。截词符一般用“?”、“:”、“#”表示1、后方截词:用于前方一致的派生词检索。如:信息?则表示在数据库中含有信息、信息技术、信息检索等方面的文献记录均为命中文献。2、前方截词:用于后方一致的派生词检索。如:?经济则数据库中含有经济、工业经济、农业经济等方面的文献均为命中文献3、中间截词将截词符放于一个字符串的中间,表示这个位置上的任意字符不影响该字符串的检索。它对于解决英美不同拼写、不规则的单复数变化等很有用。例如:analy?er可表示analyzer和analyser等不同拼写。4、前后截词字符串前后都有截词符,检索词与被检索词之间只需任意部分匹配即可。例如:“*computer*”或表示“minicomputer”、“minicomputers”、“microcomputer”、“microcomputers”或“computer”等词。截词检索在不同的计算机检索工具中规定不同,请使用时请注意先了解。字段限制检索为了缩小检索范围,可利用字段代码来限制检索词出现的字段,以提高检索速度和命中率。字段符=检索词如:au=Smith,J.C(查作者为Smith,J.C的文章)位置运算符With:设定需检索的两个词或词组必须按前后顺序出现在记录中。且两词之间不允许插入其它词;其扩展为nW,表示其两侧的检索词之间最多可插入n个词。例:dyslexiawithchildNear:设定需检索的两个词或词组在同一语句中,相对于“with”更接近。此外,在使用“near”运算符时,还可以在该运算符前添加一个数字以便进一步限定两个词之间的邻近程度,如“nN”设定需检索的两个词或词组在同一句子中且相隔不超过3个单词。例:tonguenear3base,检索出来的结果就包括tonguebase;baseoftongue;baseofthetongueIN:是用以限定某一个检索词必须出现在特定字段中的运算符号。例如:cancerinTI表示检出文献必须满足cancer出现在记录的标题字段。命中文献量:ANDWITHNEAR词间相关性:NEARWITHAND根据文献线索,索取全文应用检索工具实施检索后,获得检索结果即为文献线索,对文献线索进行整理,分析其相关程度,根据需要,可利用文献线索中提供的文献出处,索取原文。评价结果,调整检索策略,改善检索结果对检索结果进行评价,若检索结果不能满足用户的检索需求,则需要对检索策略进行调整,以改善检索结果。如何评价信息检索效果?准全检索效果评价检索效果评价查全率是衡量系统在实施某一检索作业时检出相关文献能力的一种测度指标,其计算方法为:查全率(R)=被检出的相关文献量a/库中所有的相关文献量(a+c)X100%由于在系统的数据库中,针对某一提问的全部相关文献数量不能精确获知,因此R的计算结果一般都是近似值。查准率是衡量系统在实施某一检索作业时检索精确度的一个测度指标,其计算方法为:查准率(P)=被检出的相关文献量a/被检出的文献总篇数(a+b)X100%扩大检索以便提高查全率选全同义词、相关词,或采用分类号检索,增加网罗度;调整位置算符,由严变松去掉次要的或太专指的概念组面,减少AND运算;取消某些过严的限制符缩小检索以便提高查准率提高检索提问式的专指度调整位置算符,由松变严增加概念组面,进行AND运算采用字段限制符,将检索词限定在某一特定字段中查全率与查准率的曲线关系实验得出如下查全率R与查准率P曲线,并且证明R~P之间存在着“互逆”关系。–A点:检索词数量多,泛指性强,查全率较高,但查准率却很低–B点:检索词专指性较强,查准率高,查全率降低;–C,D两点:两种极端的折衷。–R和P各自的最佳状态是逼近100%,但同时只能满足一个。要提高查全率,则要付出查准率降低的代价;要提高查准率,也要使查全率下降。查全率一般在60%~70%,查准率一般在40%~50%。查全率与查准率的关系在实际检索中,从不同检索语言出发得到的试验结果都表明了查全率与查准率之间存在互逆关系。即查全率越高时,查准率越低,反之亦然。例如:心理学是包括教育心理学的大概念,把“心理学”作为检索词具有泛指性,能提高查全率,但是正因为检索范围的扩大使得查准率降低。同样把“教育心理学”作为检索词则更具有针对性,能提高检索词的专指性,排除非相关信息,但同样也降低了查全率。R和P各自的最佳状态是逼近100%,但同时只能满足一个。要提高查全率,,则要付出查准率降低的代价;要提高查准率,也要使查全率下降。因此,用户根据用户的具体信息需求来决定其取舍。
本文标题:文献检索课
链接地址:https://www.777doc.com/doc-4536153 .html