您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 中国药科大学信检重点考试复习第四讲
第四讲计算机检索基础知识及三大中文数据库检索内容•网络的基本知识•计算机检索基本知识及技术(检索语言)•计算机检索的策略及其调整•三大中文全文数据库的检索一、Internet的发展史•1946年,电脑诞生(eniac)书P195-200Internet的发展史•1969年,Arpanet(Internet雏形)Internet的发展史•1983年,Internet诞生以TCP/IP协议为标志TCP/IP即传输控制协议,作用是把文本分成数据包,加上特别信息,使数据准确无误地发送到接受方计算机上。Internet的发展史•商业化阶段–20世纪90年代初,商业机构开始进入Internet,使Internet开始了商业化的新进程,也成为Internet大发展的强大推动力–1995年,NSFNET停止运作,Internet已彻底商业化信息的变迁硬件逐步改进带宽逐渐增加信息量呈指数级增长容量持续增大内容日渐丰富何为Internet?•Internet是指主要通过TCP/IP协议将世界各地网络连接起来,实现资源共享、提供各种应用服务的全球性计算机网络。–从网络设计者的角度考虑,因特网是计算机互联网络的一个实例。–从因特网使用者角度考虑,因特网是一个信息资源。Internet网络地址•IP地址–IP规定连入Internet的每台计算机都被分配一个唯一的32位二进制数地址,称为IP地址,它是Internet上主机的数字式标志;–IP地址写成四组用小数点隔开的十进制正数,每节数字的取值范围从0到255。•域名地址–为了便于记忆和表达,Internet上主机通常使用名字,而不是IP地址来代表。给主机命名的是域名系统(DNS),其一般格式为:计算机名.[机构名].[网络名].顶级域名Internet地址分配与管理IP地址和域名地址不是任意分配的,用户需要向网络信息中心(NIC)申请,由网络信息中心将根据用户的需要为其分配为了便于分配和管理Internet地址,1984年,TCP/IP协议规定一种文字形的上网计算机名字命名机制,即Internet的域名系统DNS(DomainNameSystem)。当用户用域名地址请求连接时,DNS可将域名地址转换成IP地址。例如:lib.cpu.edu.cn→202.119.185.11主机名机构名网络名顶级域名顶级域名•组织模式–例如,com为商业机构;edu为教育机构等•地理模式–例如,cn代表中国、us代表美国、uk代表英国等、jp代表日本、ru代表俄罗斯等。常见域名•••••二、计算机检索•定义:就是利用计算机对信息进行存贮和检索,包括信息的存贮过程和信息的检索过程。–存贮过程:把分散的信息进行搜集、整理、分析、标引,以描述信息内容及特征,输入到计算机中,建立相应的数据库。–检索过程:将用户的需求转化为检索系统可识别的提问标识,并与系统内信息进行比对,将满足用户需求的信息输出给用户。计算机检索的特点•检索速度快•信息量大、内容更新快•检索点多、检出率高•能充分达到资源共享的目的•能满足多元检索的需求•服务方式灵活以检索药学文献为例!计算机检索系统的构成•逻辑组成:指计算机信息检索系统所包含的功能模块或子系统及其相互关系。–包括数据源选择与采集子系统、标引子系统、建库子系统、词表管理子系统、系统用户接口子系统、提问处理子系统•物理组成:主要包括硬件部分、软件部分、数据库。数据库的概念与类型•定义–在计算机存贮设备上按一定方式存贮的相互关联的数据集合。•类型:按内容划分–参考数据库:书目、指南数据库–源数据库:数值、文本-数值、全文、术语、图像数据库–混合型数据库:两者结合计算机检索的类型•按检索设备及工作方式分类–脱机检索、联机检索、光盘检索、网络检索•按检索内容分类–文献检索系统、数值检索系统、事实检索系统、全文检索系统•按计算机检索提供的服务方式分类–定题检索、回溯检索、日常检索三、计算机检索技术•布尔逻辑检索•截词检索•位置运算符检索•限制检索1、布尔逻辑检索•布尔逻辑检索:是指利用布尔运算符连接各个检索词,然后由计算机进行相应逻辑运算,以检索出所需信息的方法。其常用运算符有逻辑与、逻辑或、逻辑非。•逻辑与:用“AND”或者“*”来表示相交关系如:AandB表示检索结果要同时含有A和B所代表的检索词,用于缩检。•逻辑或:用“OR”或者“+”来表示并列关系如:AORB表示检索结果要含有检索词A或者检索词B或者同时含有检索词A和B,用于扩检。•逻辑非:用“NOT”或者“-”来表示排斥关系如:ANOTB表示检索结果要含有检索词A而不能含有检索词B,用于缩检。•布尔逻辑运算的次序问题(1)默认从左到右依次运算;(2)在不同的检索系统中,逻辑与、逻辑或、逻辑非的运算次序不相同;(3)为明确运算次序,可以用小括号()来限定,多层括号的时候,先算内层括号,再算外层。•概念:截词检索就是在检索中保留相同的部分(即词干),用相应的截词符代替可变化部分,以检索出具有相同词干部分并满足相应截词规则的一种检索方法。•截词符:–*为无限截词符,代表多个字符;–?为有限截词符,代表一个字符。2、截词检索截词检索的几种截断方式•前截断(左截断、后方一致)如:*学生,可检索出:中学生、大学生、三好学生等•后截断(右截断、前方一致)如:人*,可检索出:人民、人民币、人文知识等•前后截断(左右截断、中间一致)如:*om*,可检索出:come、chrome、domo等•中间截断(前后一致,一般只允许有限截断)如:m?n,可检索出:men,man等3、位置运算符检索•概念:位置运算是单词之间的位置比较运算,只有当记录中单词的位置关系符合检索式的指定时候,文献才会被命中输出。•单词之间的位置关系包括词距和词序两个方面–词距指两个单词之间的间隔距离;–词序指两个单词之间的先后顺序。(W)与(nW)算符•(W),即With,表示算符两侧的检索词必须紧密相连(除了空格与标点符号外),且词序不可颠倒;•(nW),n为数字,如A(5W)B,表示A和B之间最多允许有5个单词间隔,且A和B之间的词序不可颠倒。(N)与(nN)算符•(N),即Near,表示算符两侧的检索词必须紧密相连(除了空格与标点符号外),且词序可以颠倒;•(nN),n为数字,如A(5N)B,表示A和B之间最多允许有5个单词间隔,A和B之间的词序可以颠倒。(F)算符•(F)算符中的“F”的含义为“Field”,表示该算符两侧的检索词必须在同一字段(如:标题、著者等)中出现,且词序可以颠倒。•例如:A(F)B,表示检索同一字段中含有AB或者BA词组的记录(S)算符•(S)算符中的“S”的含义为“Sentence”,表示该算符两侧的检索词必须在同一句子中出现,且词序可以颠倒•例如:A(S)B,表示检索句子(同一子字段)中含有AB或者BA词组的记录•比较上述的运算符,按照限制程度的大小排序,依次为:•(W)与(nW)最强•(N)与(nN)次之•(S)再次之•(F)最弱4、限制检索•字段限制检索限定检索词在数据库记录中出现的字段范围的一种方法,用于缩小查找范围。如题名、摘要等•范围限制检索主要用于出版年、记录号、专利号等字段,使用各种比较关系符来限定其与检索词的比较范围。常用比较关系有:,,=,≥,≤,≠。检索式实例•TI=(sanit*AND(fruit*ORvegetable*))•AB=pharmaceutical(F)processsanitary、sanitize或sanitizingfruit或fruits,vegetable或vegetables三、计算机检索的策略与调整•检索策略的制定•检索策略的调整检索策略的制定•分析检索课题•选择合适的信息数据库•检索词的选取•拟定检索提问式•试检索与调整检索策略•输出检索结果计算机检索的效率评价评价检索效果的常用指标有:•查全率(Recallratio)•查准率(Precisionratio)•漏检率(Omissionratio)•误检率(Fall-outratio)检索策略的调整•调整检索策略之前,必须对造成结果不理想的原因进行分析–误检?–漏检?误检原因:检索词具有多义性;截词过短;检索词太少,未排除无关概念;误组配,应用AND却用了OR;漏检原因:检索词拼写错误或过于冷僻;没有使用足够的同义词;逻辑运算符过于严格,位置运算符过多;或使用过多AND;很少使用截词算符;误检怎么办?•检出篇数过多,且不相关文献比例很大时–以AND加入相关检索词;–用NOT排除无关概念;–采用下位概念,概念具体化;–对语种、出版年代等进行限制;–引入类别限定;–增加字段限制;–采用位置运算符。。。漏检怎么办?•检出篇数过少时–选择合适的数据库;–补充足够的同义词;–把叙词作为紧邻关键词使用;–取消各种检索词的限定;–更少使用位置运算符;–减少AND算符,以OR加入相关检索词;–采用学科分类途径来扩大检索范围。。。获取网络信息资源的途径•通过搜索引擎获取•通过网络资源导航•利用机构网站和专业网站获取专业信息•利用专业数据库获取优质信息三大中文文献型数据库•中国期刊全文数据库(CNKI)•中文科技期刊全文数据库(维普)•万方数据资源系统(万方)中国期刊全文数据库CNKI简介•中国知识基础设施工程,(ChinaNationalKnowledgeInfrastructure,CNKI)•CNKI工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于1999年6月•也是中国期刊网的网络发行•我国第一个连续出版的,也是世界最大的集成化、多功能学术期刊文献检索系统KDN(知识发现网络)平台——具有的新特性一框式检索智能输入提示CNKI指数分析智能检索VS智能排序只显示1000条记录文献分析需要选择分析的文献在线阅读/组合在线阅读直接点击下载如包括会议论文等,可以进行组合在线阅读两大助手检索实例•检索:2005-2011年倍他乐克不良反应方面的高质量的期刊文献!如何进入数据库?具体检索策略非核心期刊?引入同义词如何下载文献?点击下载点击预先下载CAJ浏览器下载安装即可如何查看检索历史/痕迹?其他检索方式高级检索其他检索方式专业检索其他检索方式作者发文检索科研基金检索其他检索方式句子检索来源期刊检索中文科技期刊全文数据库重庆维普资讯有限公司开发的产品之一我国科技查新领域使用最频繁的中文期刊全文数据库国内最大规模的文摘和引文索引数据库检索时段最长的综合性科技文献数据库,收录1989年至今的文献。收录12000余种期刊,3000多万篇文献“传统检索”界面中图分类导航检索结果文献引证追踪搜索引擎服务万方数据资源系统由中国科技信息研究所和万方数据(集团)公司开发由商务信息子系统、科技信息子系统、数字化期刊系统和医药子系统等四个子系统组成率先实现了中外文期刊一站式、一体化网络服务特色资源之一特色资源之二一站式检索入口点击下载点击可以看文摘,没有购买全文三大中文数据库-小结“中国期刊全文数据库”并不是提供所有中国期刊的全文!大部分中文期刊,在3个数据库中都有收录,可能收录的年限不一。一部分期刊不在某个数据库中,并不代表其他数据库没有。一部分期刊和某一个数据库签订独家协议,其他数据库中就不能提供相关内容。想要检索中华医学会的期刊选择三大中文数据库中的哪个数据库?
本文标题:中国药科大学信检重点考试复习第四讲
链接地址:https://www.777doc.com/doc-2771215 .html