您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 基础医学 > 文献信息检索基础知识
第二章文献信息检索基础知识一、文献检索课的意义(一)学会获取各类信息的方法,减少大脑记忆的负担(二)培养高素质复合型人才,是终身教育的基础(五种能力的培养:自学、研究、思维、表达和组织管理)+创新能力(三)获取知识的捷径(四)科学研究的向导(举例)避免重复研究,节省查找文献的时间二、基本概念:1、信息(information)的概念:信息是事物的存在的形式和运动状态的表征。信息的基本属性知识性或客观性记录和传播性2、情报(information)的概念:信息或知识的有效传递。3、文献(document)的概念:记录知识的一切载体。4、文献检索的含义信息存储信息检出三、文献的分类(一)按加工程度分一次文献:论文等二次文献:目录、文摘、索引三次文献:字词典、百科、年鉴(二)按文献载体类型印刷型缩微型声像型电子型(三)按文献出版形式图书(book)期刊(journal、periodic)报纸(newspaper)特种文献图书:《常用文献信息数据库检索指南》ISBN7-5025-8655-5国际标准书号国别语种代码出版社代码顺序号校验号期刊:《政法论坛》ISSN1000-0208国际标准刊号(国际标准连续出版物编号)国内统一刊号CN11-1314邮发代号82-121特种文献:出版形式较特殊,无规律,多不公开发行。科技报告(technicalreport)会议论文(conferencepaper)专利文献(patentdocument)学位论文(dissertation)标准文献(standard)政府出版物(governmentdocument)产品资料(productliterature)技术档案(technicalrecords)四、文献检索原理(一)文献检索原理(文献存储与检索原理图)存储过程检索过程文献内容主题概念主题分析文献描述检索需要主题概念主题分析文献描述检索语言检索标识提问标识检索工具结果(二)检索语言1、概念:用于描述文献的外部及内部特征所用的语言。2、分类:检索语言描述文献外表特征的语言描述文献内容特征的语言题名(书名、篇名)语言著者语言号码语言(序列号、专利号)分类语言主题语言关键词主题词(叙词)3、分类语言:以号码为基本字符,用分类号表达文献主题概念的检索语言。(《中图法》、《人大法》)(1)《中图法》结构体系如下:★共分5大部类,22个大类,每个大类下又细分为2级、3级…类目,按照学科之间的内在联系从总到分,从一般到具体逐级展开。★标记符号采用拉丁字母与阿拉伯数字相结合的混合号码制。另外还用一些辅助符号,如:F251.2‘.’为分段标记。《中图法》(第三版)主表展开示例(简表)基本部类大类二级类三级类马列、毛泽东思想哲学社会科学ACDEF…:::K自然科学NX综合性图书Z马列、毛泽东思想哲学经济F0政治经济学F1世界各国经济概况等F2经济计划与管理F3农业经济F4工业经济F20国民经济F21经济计划F22经济计算F23会计F24劳动经济F25物资经济F27企业经济F28基本建设经济B《中图法》(第三版)主表展开示例(祥表)三级类四级类五级类…F20国民经济F21经济计划F22经济计算F23会计F24劳动经济F25物资经济F27企业经济F28基本建设经济F250物资经济理论F251物资管理F252物资流通F253物资企业经营与管理F259世界各国物资经济F251.1物资管理体制F251.2物资计划F251.3物资统计分类号类名+类目F251.3/1或F251.3“1”种次号索书号1=4、主题语言:用自然语言中的名词、词组、句子描述文献主题概念的检索语言。※主题词:表达文献主题概念的词叫主题词。当使用主题词来表达文献内容特征时叫主题标引(标识)。※主题语言的优点:1)直观符合人的辩识习惯2)专指性强主题词标识经过严格的规范化处理,查准率高。3)灵活词与词的概念组配揭示文献中各种主题。4)集中性将不同学科的同一主题文献集中在一起。例如有关“鲁迅”的文献资料,分类法将其分散在文学、艺术、文化、历史各个门类查找费时,而主题法在“鲁迅”标题下,直接反映出全部有关“鲁迅”的文献资料。主题词(叙词)关键词表述文献主题内容的规范化名词表述文献主题内容的非规范化名词受词表控制,如《汉语主题词表》不受词表控制不一定是文献中的词汇一般是文献或标题抽出的出词汇机检(查准率高)机检(查准率低)常用使用广泛几种主题语言的比较《汉语主题词表》的组成结构世界各国政区名称自然地理区划名称组织机构人物名称附表字顺主表辅助索引词族索引范畴索引轮排索引英汉对照索引←←←←→→→→《汉表》主表的著录格式(例1)汉拼Gudingzichan主题词固定资产05HB范畴类号英文Fixedassets“代”项D财产目录“分”项F非生产用固定资产生产用固定资产无形固定资产新增固定资产“属”项S国民财产“族”项Z国民财富*“参”项C国家资金、基本建设《汉表》主表的著录格式(例2)Tianzhuren天竺人Sindus;Sindhus“用”项Y古印度人☆词族索引(例3)族首词法(法律)*一级下位词.国际法04LA二级下位词..国际公法三级下位词...海洋法五、计算机检索的基本知识1、计算机检索系统的构成由硬件、软件、数据库组成2、数据库概念:存储在计算机中,可按通常方法进行检索的一系列相互关联的数据集合(有序排列)。类型参考数据库源数据库混合型数据库书目数据库(文献型)指南数据库目录数据库文摘、索引数据库人物传记数据库机构名录数据库产品数据库数值数据库文本—数值数据库术语数据库全文数据库图象数据库书目数据库(文档)的结构:书目数据库主要用于联机检索服务,通常称文挡。文档(file):若干逻辑记录组成的信息集合,是数据库的基本形式。记录(record):数据库中一个独立的信息单元,是文挡的构成单位,相当于一篇文献的款目(条目)。字段(field):在一个记录中的独立的著录项,是记录的构成单位,相当于一篇文献的著录项目。字段包括:文摘字段、题名字段、著者字段、主题词字段等子字段(subfield):字段的构成单位,如著者字段中第一作者为子字段1,第二作者为子字段2。3、计算机检索的类型计算机信息检索起源于20世纪50年代,经过半个多世纪的发展,目前,常用的检索形式有联机检索、光盘检索、网络检索等。(1)联机检索(onlinesearch)指用户借助于计算机终端和通信线路与计算机数据库中心直接进行对话的一种检索方式。用户使用终端设备与远程中央计算机相连,运用规定的指令操作,如:Dialog联机检索微机通讯网络中央计算机数据库3、计算机检索的类型(2)光盘检索(CD—ROMsearch)#光盘单机检索→最终还是网络、联机检索。#光盘联机检索微机光驱检索终端微机局域网服务器光驱检索终端3、计算机检索的类型(3)网络检索(networkedsearch)全球性的分布式结构开放式的信息环境跨国界的信息流正式与非正式信息交流渠道共存信息缺乏有效的组织管理4、各种机检的比较联机光盘因特网数据库量较多较少不计其数数据更新较快较慢很快检索方法各库较一致各库差异较大各异检索范围远程单机或局域远程/局域使用方便专业人员检索(专门知识)用户自行检索(界面友好)网络用户(网络工具)费用支付按时或按次累加或年租一次性投资租用或购买网络通讯费(按流量计)用户费用负担全部免费或少许个人负担用户精神负担较紧张较松弛自行控制检索系统的构成内容组成手工检索系统(印刷出版物)计算机检索系统(机读数据库)主体部分正文部分条目(记录)著录项主文挡记录字段索引辅助索引倒排文挡主题词索引分类码索引主题表分类表主题词表分类表使用指南说明、样例Help,F1其它资料来源索引系统5、计算机检索方式(1)命令检索(commandsearch)使用一些特定的操作命令(包括指令和检索式)来实施检索。适用于有经验的专业检索人员,联机检索用得多。(2)菜单检索(menusearch)是常用、方便、易掌握的检索方式。只需根据菜单的的指引,通过提示、选项、填空便能一步一步地完成检索,常用于光盘及网络检索。缺点是步骤多,时间长,检索功能及精度不如命令检索。(3)超文本检索(hypertextsearch)操作时用鼠标点击相关的知识单元,检索便追踪下去,进入下面各层菜单,常用于多媒体光盘及网络检索。6、计算机检索手段(检索方法、技术、方案等)目的是为了编制一种机器可识别和执行的检索式。机检中检索式是检索策略的具体表述,而检索策略是检索步骤的科学安排。下面以DIALOG检索系统为例,讨论检索的基本组配方式及操作指令。(1)常用算符逻辑算符:在各种检索方式中常用,也称布尔(Boolean)算符,用来表示两个检索词之间的逻辑关系,常用的有三种:3种逻辑关系的区别逻辑算符AND(与)OR(或)NOT(非)检索式AANDBA*BAORBA+BANOTBA—B逻辑关系的说明数据库中同时含有词A和词B的记录被检出(命中)数据库中含有词A或含有词B,或两者皆有的记录被检出数据库中凡含有词A而不含有词B的记录被检出逻辑关系图ABABAB3种逻辑关系的区别AND(与)OR(或)NOT(非)组配概念用来组配不同的检索概念用来组配表达相同概念的词用来从检索中排除某些词检索范围缩小检索范围扩大检索范围缩小检索范围举例经济*信息教育and研究自行车+单车企业or公司注射器-皮下例:检索题:跨国公司经营管理研究(营销、质量、财务)检索提问式:(跨国公司+跨国企业+跨国经营)*管理※位置算符:表示两个检索词之间的位置邻近关系,能避免布尔逻辑算符不考虑检索词位置关系而引起的某些检索误差。常用的位置算符主要有:▲(W)或()—“With”表示两个检索词必须紧挨着,词序不能颠倒,中间不能插任何词,但中间可有一个“︹”“—”“,”。A(W)B或A()B例:building(W)construction命中:“buildingconstruction”或“building—construction”▲(nw)它联结的检索词在记录中词序不能变,但可插入0—n个词如:building(1W)construction.命中记录除前面,可能会有“buildingandconstruction”“buildingunderconstruction”等形式如:building(2W)construction除前面形式外,可能会出现“buildingincompositeconstruction”“buildingdesignandconstruction”“buildingcodeandconstruction”等▲(N)—“Near”的缩写,表示两侧的检索词词序可颠倒,但在两词之间不能插词(两词必须紧挨着)▲(nN)—表示两词之间最多可插入n个词,词序可变。如:information(1N)retrieval可检出:informationretrievalretrievalofinformation等形式。▲(F)—“Field”的缩写,表示必须在记录中的同一字段(如题名字段、文摘字段)中出现,词序可变。如:Pollution(f)control可检出:controlandmanagementofindustrialpollution▲(S)—“subfield”,两词必须在记录的同一句子或同一子字段中出现,词序可变▲(L)—“Link”,表示两词必须在同一规范词单元内出现,词序可变。※截词符(提高查全率):DIALOG用“?”号表示,但有些系统用“*”等表示。(如美国专利网上检索)①有限截词▲“??”表示词干后最多允许加一个字符,如:cat??可检出cat,cats等。▲“??”“???”“????”词干后允许加一个以上字符。如:comput???可检出compute,computer,computed,computing,等词。②无限截词▲“?”词干后可加任意数量的字符,但词干不能太短。如:comput?可检出compute,computed,computer,com
本文标题:文献信息检索基础知识
链接地址:https://www.777doc.com/doc-2432355 .html