您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 数据通信与网络 > 信息检索技术(讲授版)
信息检索技术郭伟玲检索方法searchmethod检索方法及检索途径(一)检索方法查找(Searching)就是实施检索策略、搜寻所得文献信息的过程。以下几种方法,无论是计算机还是手工检索,都是常用的方法。1.“拉网法”在不了解查询某一专题信息的URL地址时,可从提供信息总目的Web页面开始浏览,沿着专题链接层层查找,直至找到有关的内容为止。然后用“书签”保存这个页面的URL,转向另一个分支。这种方法可以迅速获得较多的相关地址,然后进行筛选。就使用引擎而言,国外专家也建议先用链接页面多、响应时间快的引擎。2.引文法(跟踪法)文献之间的引证和被引证关系揭示了文献之间存在的某种内在联系,引文法(也有称为跟踪法)就是利用文献后所附的参考文献、相关书目、推荐文章和引文注释查找相关文献的方法。这些材料指明了与用户需求最密切的文献线索,往往包含了相似的观点、思路、方法,具有启发意义。引文法又可分为两种,一种是由远及近地搜寻,即找到一篇有价值的论文后进一步查找该论文被哪些其它文献引用过,以便了解后人对该论文的评论、是否有人对此作过进一步研究、实践结果如何、最新的进展怎样等等。由远及近地追寻,越查资料越新,研究也就越深入,但这种查法主要依靠专门的引文索引,如《科学引文索引》、《社会科学引文索引》。另一种较为普遍的查法是由近及远地追溯,这样由一变十,由十变百地获取更多相关文献,直到满足要求为止。这种方法适合于历史研究或对背景资料的查询,其缺点是越查材料越旧,追溯得到的文献与现在的研究专题越来越疏远。因此,最好是选择综述、评论和质量较高的专著作为起点,它们所附的参考文献筛选严格,有时还附有评论。3.常规法所谓常规法就是利用常规检索工具查找有关文献的方法,是信息时代应掌握的最基本的信息查找方法。现在对文献的书目控制手段已日趋完善,各种印刷版、缩微版、光盘版和网络版的检索工具层出不穷,有很大的挑选余地。用户应根据自己的检索知识和条件选用一种或几种检索工具。常规法可分为顺查法、逆查法和抽查法。4.排除、限定和合取法这实际上是将信息加工的方法融入检索中去。思维中使用排除这一概念,是指对查找对象的产生和存在的状态在时间和空间上加以外在否定。把这一方法移植到检索中,就是在时间或空间上极大地收缩检索范围。限定法是相对于排除法而言的,指对查找对象在时间和空间上加以内在的肯定。排除的结果必然是限定,反之亦然。(二)检索途径(检索入口)所谓检索途径就是检索时切入信息群体的路径。检索途径有两大类,一类是用信息的外部特征,如题名、责任者、某种序号、机构名等作为检索标识;另一类是用能够描述信息内容的分类号、关键词、主题词等作为检索标识。在数据库中检索时,几乎所有的字段都可以作为检索的途径。分类检索这种检索是根据信息内容的学科分类来进行的。最大的优点能保证信息的系统性,而且具有较好的族性检索功能。分类检索的要点:1。对待检课题的概念及学科间的各种关系清楚;2。正确掌握相关课题的分类名称、分类号,手工检索中掌握工具的分类排检。分类检索的步骤:1。分析待检课题,确定其学科,并厘清学科间的各种关系。2。查出待检课题的分类号(工具简单时可以省略)3。选择适当的检索工具4。进入检索系统后选择分类号途径,并在对话框内输入分类号,开始检索。5。对比题目,阅览相关信息,选出所需信息,并下载相关信息6。原文的索取类号—F204科学技术管理——类名国家科技管理入此;项目评价理论方法入F224.5.参见G311。注释和参照类级(用空格、并行和字体表示)《中图法》结构1)类目结构3/18《中图法》共五大部类,二十二个大类,53,811个类目(包括专用和通用类目)。部类大类(一级类目)二级类目三级类目四级类目五级类目…中图法8种复分表4/18《中图法》结构1)类目结构《中图法》五大部类马克思主义、列宁主义、毛泽东思想自然科学哲学宗教社会科学综合性图书5/18《中图法》结构1)类目结构F经济一级类目6/18F、经济类F0经济学F5交通运输经济F7贸易经济F6邮电经济F4工业经济F3农业经济F2经济计划与管理F1世界各国经济概况、经济史、经济地理F8财政、金融二级类目7/18三级类目F2经济计划与管理F20国民经济管理F25物质经济F28基本建设经济F27企业经济F24劳动经济F23会计F22经济计算、经济数学方法F21计划经济F29城市与市政经济8/18F25物质经济F250物质经济理论F259世界各国物质经济F253物质企业经营与管理F252物质流通F251物质管理四级类目9/1814/18《中图法》标记制度1.采用字母、数字混合制的标记符号与层累小数制的标记制度。其中,字母用来表示大类,其他各级类目则用数字表示。“T工业技术“大类范围广泛,内容繁多,故又在该类基础上采用双位拉丁字母标记所属的16个二级类目。2.对于超过10个同位类时,采用八分制(1…89192)或双位制(1112…99)。3.间隔符号.置于字母段后自左至右没三位数字后。4.推荐符号a置于马克思、恩格斯、列宁、斯大林、毛泽东、邓小平六位经典作家著作的互见分类好之后。5.总论复分符号-国家、地区区分号()时代区分号=名族、种族区分号“”通用时间、地点区分号起止符号/6.组配符号:置于相组配的类号之间,表示主类号之间的概念交叉组配。7.联合符号+当文献具有多个并列关系的主题时,需相应赋予多个分类号以表达并列主题。辅助符号的排列次序:-()“”=:+15/18《中图法》标记制度例1:《哲学辞典》类号为“B-61”,“-61”是总论复分号,表示辞典。例2:《法国的邮电事业》的类号为“F635.65”,“F63”代表世界各国邮电事业,“565”为世界地区复分号,是法国的代号。如主表类目没有注明依世界地区表复分时,则在世界地区复分号上加国家区分号“()”以示区别例3:《上海市现代摄影作品集》是“J426.51”,“J426”代表现代摄影作品集,“51”为中国地区复分号,指上海市。例4:“F813/817”各国财政,表明日本财政为F813.13,英国财政为F815.61,美国财政为F817.12。16/18检索实习题举例:图书馆图书标识:索书号图书馆同一分类号的文献数量很多,为了区别相同类号的文献,在分类号的基础上,又给了一个区分符号,这个符号称之为书次号。书次号与分类号一起共同构成索书号。浙江传媒学院图书馆的文献就是按照索书号的顺序排架管理的,书次号使用的是著者号,同样以字母+数字标明。。中文书索书号如:G254.97/Q097=217/18案例课题:工农业废水的循环利用的研究分类号分析:该课题的学科分类主要属于环境科学类,跨工业农业学科;根据《中国图书馆分类法》,涉及“废水再利用”及其分类号“X70”;工业分类号T;农业分类号为S;进一步查找《中图法》得出分类号:X703学校图书馆内检索根据分类号检索的几种结果1分类号为X703/M142分类号为X703/A423分类号为X703/L4词汇检索与分类号检索相比,词汇检索具有直观、灵活、专指性和适应性好的特点,同时检索速度也比分类检索快。词汇检索的要点:首先是要选好检索词,正确理解词间关系,检索中还要注意词间关系的正确表达。常用的词汇检索有关键词检索和主题检索。计算机检索时,选择任意字段检索时,检索项也可以是各种词汇。词汇检索的步骤:a、分析课题,确定检索词及词间关系b、选择适当的检索工具c、选择词汇检索途径,在对话框内输入检索词(注意词间关系的表达)d、根据快捷显示,选出有用信息并下载。e、原文的索取其他检索途径1、题名检索包括书名、刊名、篇名和其他信息的标题等2、作者3、机构4、号码分类号、报告号、登记号、专利号、ISBN、ISSN记录号等5、来源6、其他特殊途径(1)检索字段数据库可供检索字段有二种,一种是反映内容的主题字段,如:题名、叙词、标识词和文摘等。字段检索时,使用后缀符如:如:/TI表示Title(篇名)/AB表示Abstract(文摘)/DE表示Descriptor(叙词,规范词)例如:electron/ti表示electron一词须出现在篇名字段;electron/ti,ab表示electron一词须出现在篇名或文摘字段。后缀代码(suffixcode),对应基本索引(basicindex),反映文献的主题内容,将字段代码放在检索词之后,并用“/”号连接。另一种则是反映形式特征的检索字段,如:作者、文献类型、语种、出版时间等。前缀代码(prefixcode),往往是用于表达文献外部特征的字段,即一些辅助性检索字段,将字段代码放在检索词之前,用=号连接。如:AN=EIP98124488325(AN:AbstractNumber)文摘号AU=LIU,LITIAN(AU:Author)作者BN=0-8155-0963-4(BN:ISBN)国际标准书号CD=19880520(CD:ConferenceDate)会议召开日期AU=Salton?ANDPY=199?表示查找Salton所写的,并且是1990年后发表的所有文献。(2)限制符在一些检索系统中,提供一类表示文献类型、文种、出版时间等的限制符号,放在检索式的右边,起到约束检索结果的效果。限制符的使用和字段检索一样,也要遵循所选检索系统和数据库的规定。如在DIALOG系统中:/ENG---要求在英语出版物中检索/NONENG---要求在非英语出版物中检索/1998:2000----要求在1998--2000年的出版物中检索Chess/PAT---表示检索结果只要chess这一主题的专利文献。基本检索技术searchskill1.检索算符2.检索策略3.检索评价检索算符1、布尔检索AND(默认、空格、+、allofthesewords)OR(必须大写,关键词1、关键词2,|,/,anyofthesewords)NOT(-,noneofthesewords)NEAR下面以“计算机”和“文献检索”两个词来解释三种逻辑算符的含义。①计算机”AND“文献检索”,表示查找文献内容中既含有“计算机”又含有“文献检索”词的文献。②计算机”OR“文献检索”,表示查找文献内容中含有“计算机”或含有“文献检索”以及两词都包含的文献。③计算机”NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。这里需要说明的是,在Windows环境下,尤其是在中文数据库及网站中,逻辑检索可以用算符将检索要求编成综合表达式向计算机一次输入检索提问,也可以用窗口上的逻辑指令按钮(与、或、非)进行分步组配提问和检索。案例布尔逻辑算符布尔逻辑算符是规定检索词之间逻辑关系的算符,利用布尔逻辑算符进行检索词或代码的逻辑组配,是计算机信息检索系统中最常用的一种检索方法,也称布尔检索。布尔逻辑算符通常包括以下三种:(1)逻辑“或”:(OR)或“+”表示(2)逻辑“与”:(AND)或“*”表示(3)逻辑“非”:(NOT)或“-”表示(1)逻辑“与”(AND或*)逻辑“与”(AND)是用来组配具有相互交叉限定关系的检索概念。逻辑“与”有时也用“*”代替,其含义是检出的记录中同时含有“AND”前后两个检索词。如:查找有关“纳米”和“材料”方面的文献时,其检索式为:●NanoANDMaterials●Nano*Materials当你希望所找的文章中包含两个或两个以上的检索概念时,你可以在检索式中用“AND”将这些关键词连接起来,表示这些关键词必须同时出现在记录中的某处。使用“AND”将缩小检索范围。如:studentsANDInternet输入上面这个检索式,会找到关于students和internet同时出现的文章,只包含其中一个词的文章是不会被检索到的。因此,在连接不同概念的检索词时,AND是非常有用的。在一个检索式中,AND可以被使用多次。如:studentsANDInternetANDassignments有的中文数据库用“*”来代替AND,就象下面的这个例子。当然,不是所有的中文数据库都
本文标题:信息检索技术(讲授版)
链接地址:https://www.777doc.com/doc-46126 .html