您好,欢迎访问三七文档
1第二讲信息咨询部于明洁2►文献信息的类型与标识►文献检索原理及其相关概念►文献信息检索-检索工具-检索途径-检索方法-检索技术-检索策略*要解决的问题3计算机信息检索基础►1.计算机检索相关概念►2.计算机信息检索技术►3.信息检索策略41.计算机检索相关概念►1.1计算机检索系统检索终端通信网INTERNET服务器(数据库/文档)5免费检索收费检索通过IP地址控制(云大数据库资源)通过用户认证控制IP+用户认证►联机检索►光盘检索►网络检索计算机检索的类型6数据库结构1.2数据库信息检索数据库组织信息的一种常见的方法,内容结构如下:字段(field)记录(record)文档1(file):一张表就是一个文档文档2文档n数据库(database)7字段(数据库)=款目(著录、标引)=检索点/检索入口/检索字段(检索界面)/检索项/检索途径和文献内部特征相关的字段:基本索引字段,如题名、摘要和文献外部特征相关的字段:辅助索引字段,如作者、作者单位8文献型事实型图像型/超文本型其它类型数据库类型数据型书目型全文型电子期刊电子书电子报纸92.计算机信息检索技术(考点)►计算机检索过程中,为保证检索结果准确全面、经济高效,各计算机检索系统均为用户提供了多种不同的检索功能,其中使用最普遍的就是“布尔逻辑算符”、“位置算符”和“截词符”。►注意:不同数据库所用算符标识不同102.1布尔逻辑检索:用布尔逻辑算符将检索词、短语或代码进行逻辑组配指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献它是机检系统中最常用的一种检索方法。逻辑算符主要有:►And/与、Or/或、Not/非◆11►逻辑“与”►运算符:And或*►检索式为:AAndB或者A*B►含义:检索词A,B在特定的检索字段中同时出现。►作用:能增强检索的专指性,使检索范围缩小。►例:informationandsharing121314►逻辑“或”►运算符为Or或+►检索式:AOrB或者A+B►含义:检索词A,B在特定的检索字段中同时或其中一出现。►作用:逻辑“或”使检索范围扩大。►例:informationorsharing1516►逻辑“非”►运算符:Not或–►含义:在指定字段中含有A词,但同时不含B词的记录。►检索式:ANotB或者A-B►作用:和逻辑“与”运算的作用类似,使检索范围缩小,增强检索的准确性。►注意:算符前后的检索项不可互换►例:informationnotsharing1718嵌套检索(组合检索式)——根据检索需求多次运用逻辑算符例:查有关造纸废水处理方面的文章(papermakingORpaperpulp)ANDwastewaterAND(treatORtreatment)19►对于一个复杂的组合逻辑检索式,检索系统的处理是从左向右进行的►在有括号的情况下,先执行括号内的运算;►有多层括号时,先执行最内层括号中的运算,逐层向外进行►例:ti:(经营or管理)and(酒店or饭店)►Ab:生态保护*丽江-旅游202122使用布尔逻辑运算符组合检索需注意的问题:中文数据库中多用*、+、-符号;英文数据库一般用AND、OR、NOT表示布尔逻辑运算;有括号时,先执行括号里面的运算,没有括号时,AND、OR、NOT的运算顺序在不同的系统里有不同的规定,如在Dialog里,是按照NOT、AND、OR的顺序执行。232.2位置检索/邻近检索:是在检索词之间使用位置算符(AdjacentOperators),来规定算符两边的检索词出现在记录中的位置,从而获得不仅包含有指定检索词而且这些词在记录中的位置也符合特定要求的记录。作用:这种方法能够提高检索的准确性,当检索的概念要用词组表达,或者要求两个词在记录中位置相邻/相连时,可使用位置算符。位置算符主要有:W、N◆24►w算符with:XwY(X后面紧接着Y)前后顺序不能颠倒XwNY(X后面紧接着Y,而且X和Y之间最多只能有N个词)。►例:headw2class►n算符near:XnY(X靠着Y)前后顺序可以颠倒XnNY(X和Y之间最多只能有N个词,X和Y可前可後)。►N是阿拉伯数字,表示两个检索词在结果中相互距离不超过N个词(在中文情况下不超过N个字)。►例:informationnsharing,informationwsharingASameB:在同一个子字段或同一个自然句中(Sentence)AParagraphB:在同一个段落中252627使用位置检索需注意的问题:英文数据库常用;多数用于数据库的专业检索方式(需输入检索指令的检索);不同的数据库用到的位置算符不一样,使用前查看检索提示或相关帮助。282.3截词检索►是指用给定的词干做检索词,查找含有该词干的全部检索词的记录,也称词干检索或字符屏蔽检索。►作用:它可以起到扩大检索范围,提高查全率,减少检索词的输入量,节省检索时间,降低检索费用等作用。►截词符主要有:*,?29无限截词(一个符号可代替任意个字母):Treat*:Treattreatingtreatedtreatmentsul*ate:sulphatesulfate有限截词(一个符号只代替零或一个字母):Wom?n:womanwomen►例如:输入geolog*(*为截断符号),将会把含有geological、geologic、geologist、geologize、geology等词的记录检索出来。303132使用截词检索需注意的问题:仅对英文数据库;不同的系统使用的截词符号是不一样的,使用前应查看检索提示或相关帮助。332.4精确(exact)检索:检索特定的句子或词组:使用引号引起词组34使用精确检索需注意的问题:不同的数据库对精确检索的规定不一样,大多数数据库使用“”;有的数据库使用空格即可;还有一些数据库通过特定程序控制352.5限定字段检索:In是一种包含(相似)关系In的用法:检索词in字段名称=为精确的比较=的用法:字段名称=检索词需要注意的问题:一般用于数据库的专业检索方式;在特定的数据库中,哪些字段可以运用=,哪些只能用in36►分类浏览Categorybrowse►简单检索Simplesearch,Basicsearch►高级检索advancedsearch►专家检索Expertsearch2.6计算机检索工具/检索系统的检索方式372.7聚类检索:在对文献进行自动标引的基础上,构造文献的形式化表示——文献向量,然后通过一定的聚类方法,计算出文献与文献之间的相似度,并把相似度较高的文献集中在一起,形成一个个的文献类的检索技术。例如:CNKI“相似文献”382.8扩展检索与缩检:扩展检索扩展检索的方法:概念的扩大;范围的扩大;增加同义词;年代的扩大缩小检索,又称二次检索缩检方法:即概念的缩小、范围的限定、年代的减少等。此外,还可以通过对核心概念、语种、特定期刊等进行限定检索。39缩检40常用的检索方式优点缺点基本检索(简单检索)只有一个检索框,大部分数据库可使用各种运算符约束条件少,不能准确地表达检索用户的检索意愿,对有的数据库来说需要掌握一定的检索指令高级检索(推荐)提供多个检索框,以及多种约束条件,基本能够表达用户的检索意愿;不需要构造复杂的检索式,一般只提供检索词即可,简单灵活有的数据库不允许在检索框中使用运算符专家检索只有一个检索框,可随意书写合法的检索表达式,比较灵活需要掌握一定的检索指令,指令的书写容易出错各种检索方式优缺点比较413.信息检索策略(考点)必要性检索系统的问题:信息检索技术缺乏知识处理能力和理解能力。忠实表达的问题:很多情况下,用户很难简单地用关键词或关键词串来忠实地表达他所真正需要检索的内容,表达困难导致检索困难。表达差异的问题:同一概念,不同的用户可能使用不同的关键词来查询。词汇孤岛的问题:人们所思考的概念并不是孤立存在的,它总是与其他概念之间存在各种各样的联系,人们检索还想得到与此概念相关的其他没有被表达出来的信息。42►什么是检索策略就是在分析检索课题需求的基础上明确检索范围,选择检索途径,确定检索词和构建检索式的逻辑组配方法,通过试检或反馈进行调整,使检索结果体现用户目标的整个计划过程。431.确定课题方向2.分析研究课题3.选择检索工具4.确定检索途径5.选择检索方法6.制定、调整检索策略文献信息检索过程44文献信息检索具体步骤1.分析课题,明确目的2.选择检索系统和数据库3.确定检索词和检索途径4.制定检索式5.调整检索策略451.分析课题,明确目的分析检索课题的基本方法与技巧:►1.1分析检索课题的内容实质,界定范围必须准确充分地表达检索课题所需的实质性内容,如果表示的概念过大,必然造成大量误检;而表达的概念过小,则会发生大量漏检。如,查找“中国新农村建设”方面的文献通过分析研究,检索人员了解到该课题实质上是要查找有关“农村医疗保障制度”的参考文献,如果按原题检索,由于概念太大,必然会造成大量误检。46►1.2找出隐性的主题概念将抽象的主题概念转化成具体的概念如:“城市生活垃圾的处理”:处理一词在这包含了具体的处理方式:回收、再生等如:“区域旅游合作”合作一词也可以通过协作、联盟、联手、联动、协同开发等来表示,同时还可以利用旅游区联合、旅游带、区域旅游系统等相关概念来查找文献信息,对于英文文献的查找还要考虑到同义或词性变化的问题,如:cooperation(ive),collaborate(tion)等47►1.3找出核心概念排除无关概念和重复概念,简化逻辑关系以提高检索效果。如:排除课题中那些检索意义不大而且比较泛指的概念词,诸如“展望”、“发展趋势”、“现状”、“近况”、“生产”、“研究”、“应用”、“作用”、“方法”、“影响”、“效率”、“制造”、“结果”等等。无关概念:技术、研究等(删除理由:没有检索意义);新型、材料等(删除理由:意义蕴含,且“新型”意义模糊)如:“干洗剂的近况及其使用”课题其核心概念是干洗剂48►1.4明确概念之间的逻辑关系分析出单元概念后,还要搞清它们之间的逻辑关系,即不同概念之间是逻辑与的关系,而相同概念之间为逻辑或的关系。例如:协作or联盟or联手or联动or协同开发492.选择检索系统和数据库分析检索课题的基本方法与技巧:►应根据课题分析结果、信息需求的各项要求综合考虑现有检索系统的特点:学科范围、文献类型、存储年限、检索费用、使用方法,选用合适的检索系统或数据库资源。503.确定检索词及检索途径►检索词是构成检索式的基本单元,是文献记录中的文献特征标识,可以是反映文献内容特征的主题词、自由词等;也可以是反映文献外表特征的作者、篇名等。►检索途径即检索入口,计算机检索系统的检索途径也可分为反映文献信息内容(内部)特征和反映文献信息外部特征的两类检索途径。►选择检索途径是与确定检索词相对应的,确定了检索词也就意味着选择检索途径。51“已知”的信息特征应与文献特征相对应文献的特征外部特征内部特征题名著者序号分类主题关键词外表特征内容特征文献524.制定检索式►检索式是检索策略的具体表述,是通过逻辑算符、位置算符、截词算符等把表达主题概念的各检索单元组配、连接起来,既能表达主题内容,又能为机器识别和执行的命令形式,也是决定检索策略的质量和检索效果的重要因素。53制定提问检索式实例1检索“电子商务中的税法研究”方面的资料检索词:电子商务electroniccommerce,e-commerce税法、税收taxlaw检索表达式:电子商务*(税法+税收)(electronicwcommerceORe-commerce)ANDtaxwlaw54检索“中国城乡收入差距”方面的文献检索词:城乡、城镇、区域:RuralandUrbanAreas,dualeconomicstructure收入差距:IncomeGap,IncomeInequality,incomedisparity,incomeallocation检索式:(城乡+城镇+
本文标题:文献检索第二讲.
链接地址:https://www.777doc.com/doc-2338265 .html