您好,欢迎访问三七文档
§3-2信息检索的基本步骤1信息检索的基本步骤:(1)课题分析(2)选择检索系统(3)抽取检索词(4)构造检索式(5)文献检索及检索式的调整(6)检索结果的处理第一步分析课题明确文献检索的目的;明确课题要解决的实质问题;明确有哪些主题概念;各主题概念之间的关系;明确课题涉及的学科范围;明确课题所需文献信息的语种、时间范围等具体要求。课题名称三维打印技术的应用湖泊富营养化的处理主题概念(检索点)涉及学科语种和时间范围三维打印、应用富营养化、处理、湖泊涉及光学、机械学、电学、计算机技术、数控技术及材料技术等。涉及生物学、环境科学等。中文文献,不限时间中文文献,近十年内发表文献案例分析:第二步选择检索系统选择检索工具时要考虑:专业性,即选择与学科专业相关的工具,特别注意跨学科领域内容。权威性,尽量选择该学科的权威性检索工具。了解检索工具收录的范围,包括时间跨度、地理范围、文献语种、类型、揭示深度等。了解检索工具的检索方法和系统功能中文检索系统可考虑CNKI、万方、维普数据库,外文数据库可考虑使用ScienceDirect、Springer、JohnWiley、WOS等。课题名称三维打印技术的应用湖泊富营养化的处理检索系统CNKI、万方、维普CNKI、万方、维普案例分析:方法:切分、去除、替补注意:(1)准确、专业。不要将一些意义广泛的词作为检索词,如研究等。(2)全面。考虑:a基于概念的上下位词,如可再生能源与太阳能。b同一检索词的不同表达方式,如白血病与血癌。c基于检索结果的同义词或近义词。第三步提炼检索词关键词或叙词、主题词选词特点(1)是能够揭示主题内容的语词关键词应该是表示最小概念的语词虚词(不可用):连词、副词、介词、助词、语气词宽泛概念的词(不可用):研究、技术、问题、方法…是能够揭示主题内容的语词关键词应该是表示最小概念的语词关键词或叙词、主题词选词特点(2)课题名称三维打印技术的应用湖泊富营养化的处理检索词三维打印、3D打印、应用、运用富营养化、水华、处理、治理、净化、修复、防治、湖泊、湖案例分析:检索式是检索策略的逻辑表达式,是用来表达用户检索提问的,由基于检索概念产生的检索词和各种组配算符构成。组配算符通常有布尔逻辑算符、截词符(通配符)、位置算符、嵌套算符(优先算符)四种。第四步构造检索式布尔逻辑组配运算是采用布尔代数中的逻辑“与”逻辑“或”、逻辑“非”等算符,将检索提问式转换成逻辑表达式,限定检索词在记录中必须存在的条件或不能出现的条件。凡符合布尔逻辑所规定的条件的文献,即为命中文献。布尔逻辑算符组配检索逻辑“或”—————————————————AB用符号“or”或“+”表示,其逻辑表达式为:AorB或A+B其意义为检索记录中凡含有检索词A或检索词B,或同时含有检索词A和B的,均为命中文献。逻辑“与”————————————————AB用符号“and”或“*”表示,其逻辑表达式为:A*B或AandB其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。逻辑“非”————————————————AB用符号“not”或“-”,其逻辑表达式为:AnotB或A-B其意义为:检索记录中含有检索词A,但不能含有检索词B的文献,才算命中文献。课题名称三维打印技术的应用湖泊富营养化的处理检索词三维打印、3D打印、应用、运用富营养化、水华、处理、治理、净化、修复、防治、湖泊、湖检索式案例分析:(三维打印+3D打印)*(应用+运用)富营养化*(处理+治理+净化+修复+防治)*(湖泊+湖)水华*(处理+治理+净化+修复+防治)构造检索表达式注意事项:1同义词或近义词之间用“逻辑或”组配2所有标点符号均在英文状态下输入。3注意优先算符()的使用。选择合适的检索途径:题名途径(Title)责任者途径(Author)机构途径(Affiliation)序号途径(Code)分类途径(Classification)主题途径关键词途径其它途径第五步文献检索及检索式的调整根据课题的已知条件和课题范围和检索效率要求,选择合适的检索途径。题名/关键词/摘要/主题/全文一般来说,当检索结果不理想时,可以从以下几点考虑检索式的调整:(1)检索词是否准确?是否有同义词、近义词或其它隐含的词未被抽取。(2)检索式是否准确?是否有全角字符?组配算符是否正确合理?(3)检索途径是否合理?可考虑从不同的检索途径进行试检索,必要时用全文检索。第六步检索结果的处理检索结果的处理包括文献信息的选择、下载、存盘以及文献的阅读与引用。对于有参考价值、拟在论文写作过程参考或引用的文献,要逐篇下载,并将所有下载的文献信息按引文格式存盘,以便在论文的参考文献列表中使用。2检索效果的评价指标检索效果(RetrievalEffectiveness)是指检索系统检索的有效程度,它反映了检索系统的能力。包括技术效果和经济效果。克兰弗登(Cranfield)评价系统性能的指标:♦收录范围♦查全率♦查准率♦响应时间♦用户负担♦输出形式查全率是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度。可用下式表示:查准率它是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统检出文献准确度的尺度。可用下式表示:查全率和查准率在一定程度上成反比关系。应根据具体课题的要求,合理调节查全率和查准率,保证检索效果。
本文标题:信息检索基本步骤
链接地址:https://www.777doc.com/doc-5593663 .html