您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 基础医学 > 第2章 文献检索基础知识
专题二文献检索基础知识1文献检索的基本原理一、信息检索的含义广义上:文献检索是指把文献按一定方式组织和存储起来,并针对用户的需求找出所需文献的过程。狭义上:信息检索指用户利用检索工具和检索系统从有序的信息源中,查询所需信息的检索过程。即文献检索就是文献的查找过程。二、信息检索原理概述•广义的信息检索包括信息的存储和检索两个过程。•信息的存储就是将搜集到的一次信息,经过著录其特征(如题名、著者、主题词、分类号等)而形成款目,并将这些款目组织起来成为二次信息的过程。•信息的检索是针对已存储好的二次信息库进行的,是存储的逆过程。•存储是为了检索,而为了快速而有效地检索,就必须存储。•没有存储检索就无从谈起。•存储与检索是相辅相成、相互依存的辩证关系。图1信息检索原理图2信息检索分类•一、按检索内容划分1.文献检索•文献检索(DocumentRetrieval)即从一个文献集合中查找出专门包含所需信息内容的文献,是以文献为检索对象的信息检索类型。•文献检索根据所检索内容的不同分为书目检索和全文检索。•2.数据检索•数据检索(DataRetrieval)以特定数据为检索对象和检索目的的信息检索类型称为数据检索。•包括数据图表,某物质材料成分、性能、图谱、市场行情,物质的物理与化学特性,设备的型号与规格等,是一种确定性检索。•3.事实检索•事实检索(FactRetrieval)是获取以事物的实际情况为基础而集合生成新的分析结果的一类信息检索,以从文献中抽取的事项为检索内容,包括事物的基本概念、基本情况,事物发生的时间、地点、相关事实与过程等。二、按信息检索的方式划分根据信息检索的基本原理,实现信息检索的基本方式可分为传统信息检索和现代信息检索。传统信息检索,简称“手检”;现代信息检索,简称“机检”。按照检索的操作方式,信息检索分为手工检索和计算机机器检索。1.传统信息检索传统信息检索,即手检。手工检索是检索人员利用手工检索工具手翻、眼看、大脑思维判别、索取原始文献的一种方式。优点是:①检索条件简单,成本低;②在检索过程中可以随时获取反馈信息,及时调整检索策略;③可对不同的检索工具同时进行对比,从而提高检索质量;④可以参阅检索工具中的附图。缺点是:①速度慢、效率低,检出的文献款目必须抄录;②手工检索工具提供的检索点有限,很难进行多元检索;③难以找到涉及几个概念组合的多主题文献。2.现代信息检索现代信息检索即机检,是检索人员利用计算机检索系统查找文献的一种检索方式。所谓计算机检索系统包括数据库技术、计算机技术和通信技术等。计算机检索已从单机检索、联机检索发展到今天的网络检索,并正向着智能化的方向发展。3检索语言(一)检索语言分类外表特征语言内容特征语言题名(书名、刊名、篇名)著者号码(如专利号、报告号等)引文分类语言主题词语言代码语言分子式、结构式检索语言文献类型文献出版事项二、两种常用检索语言两种常用的检索语言(按检索语言结构原理划分)(1)分类语言(2)主题词语言体系分类语言组配分类语言混合分类语言标题词语言单元词语言关键词语言叙词语言(一)分类语言分类语言是根据一定的观点,以科学分类为基础,文献内容的科学性质为对象,按照知识门类的逻辑顺序来组织和检索文献的一种语言工具。•按学科体系的层次,从上到下,从总到分,逐级展开,各级类目一一列举。中国图书馆分类法简表基本部类将图书分为社会科学、自然科学、综合三大类。社科自然科学自然科学O数理科学和化学O1数学O11古典数学O119中国数学O12初等数学O13高等数学O14数理逻辑、数学基础O15代数、数论、组合理论O17数学分析O171分析基础O172微积分O172.1微分学O172.2积分学O173无穷级数论(级数论)O174函数论O175微分方程、积分方程O176变分法O177泛函O178不等式及其他……O3力学O4物理学O6化学O7晶体学分类标识即分类号由字母和数字组成采用等级列举表达从属关系上位类目一定能包含其各个下位类目,下位类目一定带有上位类目的属性。•F2经济计划与管理TQ03化学反应过程•…………•F27企业经济TQ031一般化学反应过程•……TQ031.2合成•F276各种企业经济TQ031.3分解、裂化•F276.4联合企业经济……•F276.41部门间经济综合体TQ032催化反应过程•F276.42科研生产联合企业TQ033生物化学过程•F276.43合资经营企业分类号越长,表示的学科范围越窄。类、类目共同属性的集合一类事物的概念•TG44焊接工艺•441一般方法•442熔焊•443电焊•444电弧焊•445埋弧焊(焊剂层下焊)•446气焊•447电铆焊•…下位类同位类上位类(二)主题语言•1.主题法•主题法是一种从文献内容角度标引和检索信息资源的方法。以主题语言来描述和表达信息内容的信息处理方法称为主题法。主题语言又可分为标题语言、元词语言、叙词语言和关键词语言。2.主题检索语言•①标题语言•标题法是一种以标题词作为主题标识来反映文献信息内容的一种主题法。•标题词必须统一和规范。《美国国会标题表》•②单元词语言•单元词法,也叫元词法,是以元词为主题标识,通过字面组配的方式表达信息资源主题的主题法。•所谓元词是用来标引信息资源主题的、最基本的、字面上不可再分的语词。•③叙词语言•叙词,国内亦称主题词,是经过规范化处理的,以基本概念为基础的表达文献主题的词和词组。•叙词语言就是以叙词作为文献检索标识和查找依据的一种检索语言。•④关键词语言•关键词语言是直接选用文献中的自然语言作基本词汇,并将那些能够揭示文献题名或主要意旨的关键性自然语词作为关键词进行标引的一种检索语言。4信息检索的方法和途径•(一)信息检索方法的类型•1.常用法(工具法)•(1)顺查法•(2)倒查法•(3)抽查法2.回溯法(引文法)•回溯法,也称为引文法,是利用文献末尾所附的参考文献或引用文献,由近及远(由现在到过去)地进行追踪检索。3.循环法(分段法)•循环法,是综合常用法和回溯法的检索方法,即在检索文献信息时,既利用成套的检索工具检索,又利用原始文献后所附的参考引用文献进行回溯,分阶段按周期地交替使用,也称为分段法。•循环法的具体操作可以采用两种方式。•(1)首先使用常用法,然后使用回溯法,不断循环交替。•(2)首先使用回溯法,然后使用常用法,不断循环交替。(二)文献检索途径文献的检索途径是根据文献的描述内容来确定的。检索路径主要包括以文献的外部特征进行检索的基本途径(如文献的名称、作者、出版信息等)和以文献的内容特征进行检索的主流检索途径(即分类法和主题法)。(1)外部特征途径文献的外部特征,是从文献检索载体的外表上标记的可见的特征,如题名(书名、刊名、篇名)、责任者(作者、编者、译者、专利权人、出版机构等)、号码(文献原有序号、标准号、专利号、报告号、索书号等)。(1)外部特征途径①文献名称途径:书、刊、杂志、文章名②著者途径:③代码检索途径代码检索途径是以某些文献所具有的特指或特定的代码为线索开展检索的途径。(2)内容特征途径文献的内容特征,是从文献所载的知识信息中隐含的、潜在的特征,如分类、主题等。以文献的内容特征作为检索途径适用于检索未知线索的文献。(2)内容特征途径①分类途径分类途径是以文献所反映的内容所属学科的分类体系为线索开展检索的途径。(2)内容特征途径②主题途径主题途径是以文献所反映的主题内容为线索开展检索的途径。是把每一个文献(一本书、一篇论文、一件专利等)中的能够体现文献主题概念、事物特征、具有实际意义的词语抽取出来,作为检索标识供大家检索,从而使得用户可以从不同学科背景、不同检索需求出发,检索到同一主题的所有文献。(3)其他检索途径还有一种根据引证关系建立起来的检索途径,即引文途径(见下面引文法)。在进行文献检索时,检索途径的最终选择既受课题已知条件和课题检索深度的影响,同时更取决于检索系统已经为我们提供的各种检索入口。要取得既完善又准确的检索结果,正确地选择检索途径是很关键的;同时,用户所具有的数据库知识、检索技能以及对检索目标的把握情况也是非常重要的。•1.分析待查项目,明确主题概念•2.选择检索工具•3.确定检索途径和检索标识•4.查找文献线索,索取原文5信息检索的步骤6检索结果的评价检索效果指利用检索系统或工具检索信息资源的有效程度,直接反映了检索系统的检索性能及能力,是评价一个检索系统性能和用户检索策略的质量标准。(一)信息检索的基本要求•信息检索的基本要求就是要用最少的时间和精力,快速获取所需的文献信息,同时检出的文献要全面、准确。全面:是根据课题需要,将有关文献尽可能地全面检索出来,尽量做到系统、完整、无重大遗漏,也就是要提高查全率。准确:要对检出的文献进行严格筛选,信息内容要准确可靠,使其符合课题需要,力求避免查出与课题无关的文献,也就是要提高查准率。(二)检索结果的评价信息获取后,要认真分析、比较、概括和综合,以保证信息的真实性、准确性。当检索结果显现太多和研究课题不相关的记录、显现太少和研究课题相关的记录或没有和课题相关记录时,必须重新思考并建立检索命题,对检索策略进行优化、缩检或扩检。然后对检索结果进行组织整理:检出的资料是否与研究主题相关?是学术性文章,还是通俗性文章?是否新颖?资料是否具有权威性?是否可信?(二)检索结果的评价衡量检索效果有两个主要指标,即查全率和查准率分别用字母R和P表示。•1.查全率•查全率指系统实施检索时检出的与某一检索提问相关的信息资源数与检索系统中与该提问相关的实有信息资源总数之比。表示为:•查全率(R)=(检出有关信息资源量/系统中有关信息资源总量)×100%2.查准率查准率也称检准率、相关率、检索精度,指系统实施检索时检出的与某一检索提问相关的信息资源数与检出的信息资源总数之比。表示为:查准率(P)=(检出有关信息资源量/检出信息总量)×100%2.查准率查准率是反映检索系统排除与检索提问无关信息资源的能力。研究表明:世界上最好的搜索引擎其查全率也只有45%,查准率更低。对于一个检索系统来讲,查全率和查准率往往不可能两全其美:查全率高时,查准率低;查准率高时,查全率低。3.查全率和查准率的局限性查全率的局限性主要表现在:它是检索出的相关信息量与检索系统中的全部相关信息量之比,但系统中相关信息量究竟有多少一般是不确知的,只能估计;另外,查全率或多或少具有“假设”的局限性,这种“假设”是指检索出的相关信息对用户具有同等价值,但实际并非如此,信息的相关程度在某种意义上比它的数量重要得多3.查全率和查准率的局限性查准率的局限性主要表现在:如果检索结果是题录式而非全文式,由于题录的内容简单,用户很难判断出检索到的信息是否与课题密切相关,必须找到该题录的全文才能正确判断出该信息是否符合检索课题的需要;同时,查准率中所讲的相关信息也具有“假设”的局限性。4.提高检索效果的措施•(1)选择质量较高的检索工具•评价检索工具的优劣主要看它的存储功能和检索功能,即“全”“便”“新”。(2)提高检索者的检索水平检索者的检索水平是提高检索效率的核心因素检索者应具备一定的检索语言知识,能正确理解检索课题的实质要求,选取正确的检索词,并能合理使用逻辑组配符完整地表达信息需求的主题;还要能灵活运用各种检索方法和检索途径,制定最优的检索策略;同时在检索过程中采用严谨的科学态度,耐心细致地检查检索步骤的各环节,以减少人为的错检和漏检。
本文标题:第2章 文献检索基础知识
链接地址:https://www.777doc.com/doc-3519888 .html