您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 文献检索与利用清华大学第四节课1-中文数据库检索式及检索技巧
文献检索与利用(理工类)典型中文数据库检索与利用赵军平清华大学图书馆学科服务组62782367zhaojunping@tsinghua.edu.cn除了中国知网外,您知道可以检索中文文献的平台还有哪些吗?它们之间的关系如何?您用过专业检索方式进行检索吗?(24%)检索结果太多,没法挑选相关文献;检索结果太少,找不到相关文献;检索结果不少,但是方向似乎偏了,无相关文献;检索结果太烂,有价值的文献太少;我只想找综述文献,但是出来的都是具体技术;……检索文献时,你是否遇到过此类问题?典型中文数据库检索与利用中文检索平台介绍以中国知网为例学习文献检索典型中文数据库检索与利用中文检索平台介绍1.中国知网2.中文科技期刊库3.万方数据资源系统以中国知网为例学习文献检索中国知网中国知网是中国学术期刊电子杂志社编辑出版的以《中国学术期刊(光盘版)》全文数据库为核心的数据库,目前已经发展成为“CNKI数字图书馆”。收录资源包括期刊、博硕士论文、会议论文、报纸、专利、标准、科技成果、工具书等学术与专业资料;覆盖理工、社会科学、电子信息技术、农业、医学等学科范围,数据每日更新,支持跨库检索。正式出版的7877种学术期刊;特色期刊(如农业、中医药等)收录率100%;独家或唯一授权期刊共2300余种。目前本校读者可访问的主要数据库如下:全文数据库中国学术期刊网络出版总库(1915年-)中国优秀硕士论文全文数据库(1999年-中国博士论文全文数据库(1999年-)中国重要会议论文全文数据库(1999年-)中国专利数据库(1985年-)中国重要报纸全文数据库(2000年-)国家标准全文数据库(1950年-)中国行业标准全文数据库(1950年-)中国年鉴全文数据库(1999年-)中国工具书网络出版数据库德国SPRINGER公司期刊数据库题录/文摘数据库中国引文数据库(1979年-)国家科技成果数据库(1978年-中国标准数据库国外标准数据库哈佛商业评论数据库事实数据库中国工具书网络出版总库汉语大词典&康熙字典(知网版)数值数据库中国经济社会发展统计数据库等全文数据库最多中文科技期刊库《中文科技期刊数据库》(全文版)是重庆维普资讯有限公司开发研制的中文电子期刊数据库,收录我国自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报等学科12000余种期刊的2300余万篇文章的全文,每年增加约250万篇。该数据库中的期刊回溯至1989年,但有部分期刊收录不完整。该数据库检索入口较多、辅助手段较为丰富。同时,由于本馆未定购人文社科版,该类文献只提供文摘,无法获取全文。有很多独家收录的期刊,在中国知网和万方数据中检索不到。万方数据资源系统万方数据资源系统是建立在因特网上的大型科技、商务信息平台,内容涉及自然科学和社会科学各个专业领域。包括:学术期刊、学位论文、会议论文、专利技术、中外标准、科技成果、政策法规、新方志、机构、科技专家等子库。我馆仅购买了期刊文献的全文,万方数据提供多数专利的全文。我馆没有购买中国学位论文全文库、中国学术会议论文全文库、西文会议论文全文库等全文数据库,所以即使检索到全文数据库的文献,也不能查看和下载其全文,只能查看其简单信息或详细摘要信息。2008年万方数据获得中华医学会旗下115种医学核心期刊的独家数字出版权。这是由三家有竞争关系的数据公司开发的数据库,数据有大量重复,但是又各有独家特有的数据,检索信息时需要互相补充。检索算符基本相同,但是检索式制定细节略有区别。进入方式:图书馆主页——资源——数据库导航数据滞后于原文献出版,IP(+用户名密码)控制全文下载典型中文数据库检索与利用中文检索平台介绍以中国知网为例学习文献检索检索方式•简单检索•高级检索•专业检索检索式的制定及调整CNKI简单检索界面CNKI高级检索界面CNKI专业检索界面典型中文数据库检索与利用中文检索平台介绍以中国知网为例学习文献检索检索方式检索式的制定及调整•选择检索词•掌握检索式表达语法•熟悉检索式调整技巧•检索效果及评价指标检索词检索词:指表征研究课题主要概念的关键性词语,是构成检索提问式的最基本单元。检索词通常从课题的主要概念(课题名称、采用的具体技术/方法、新颖点)中提取,需要找出隐含概念、同义词,将泛指概念具体化,排除重复概念……一、从题目、技术要点提取检索词一般来说,理工类课题名称基本上能反映出检索的主题内容。例1:“模糊变频空调”主要概念:模糊、变频空调检索式:变频空调and模糊(布尔算符)如果不知道怎么切分怎么办?高级检索页面检索结果其次,从技术要点中的具体方法、技术及创新点中提取例2:电子行业用聚合物基屏蔽复合材料研究本项目采用颗粒表面包覆与功能设计的思想,以高剪切的机械力化学法即机械冲击颗粒复合系统(PCS)将分散、混合与固着等操作步骤相结合,把导电颗粒(包括微纤)均匀连续地包覆在聚合物颗粒表面,然后将这种复合颗粒熔融成型,制造出聚合物基屏蔽复合材料。主要概念:电子行业、屏蔽、复合材料、包覆检索式:电子行业and屏蔽and复合材料and包覆主要概念:多点激励(振动激励、声学激励、结构激励)、车内噪声(噪音、声源)、传递函数、识别(获取)数据库检索结果:在中国知网文献中检索,采用主题字段检索式1:主题=多点激励*车内*噪声*传递*识别检索结果为0检索式2:主题=激励*车内*(噪声+噪音+声源)*传递*(识别+获取)检索结果为23条记录例3:“基于多点激励的车内噪声传递函数识别方法””二、找出隐含概念、同义词唐山城市由于唐山是一个城市,该项目实际为“城市综合防灾的研究”灾害地震、洪水、火灾研究决策支持系统、专家系统所采用的研究手段是决策支持系统和专家系统。例4:项目“唐山综合防灾研究”三、泛指概念具体化主要概念:城市、唐山、灾害、地震、洪水、火灾、决策支持系统、专家系统数据库检索结果:在中国期刊网中检索(1980-2009),采用主题字段检索式1:SU=唐山*综合防灾*研究andYEbetween(1980,2009),命中5条检索式2:SU=(城市+唐山)*(灾害+地震+洪水+火灾)*(决策支持系统+专家系统)andYEbetween(1980,2009),命中41条例5:项目“河豚毒素的液相色谱分析”从该项目名称上看,其主要概念为“河豚毒素”、“液相色谱”和“分析”,但由于液相色谱本身就是一种分析方法,它隐含了“分析”这一概念。•主要概念:河豚毒素、液相色谱•数据库检索结果:中国期刊网(数据年代1980-2009),采用主题字段检索式1:河豚毒素*液相色谱*分析,命中15条检索式2:河豚毒素*液相色谱,命中28条四、排除重复概念②选用意义明确的词语。③不使用过长的词组和短语。④同义词、近义词、缩略词要找全。检索词的要求①选各学科的专用术语、规范用语。收集规范词、同义词的方法从已有的检索结果中获得以课题的主要概念作为检索词,在相关数据库中试检,并从题名、摘要、关键词中收集规范词、同义词。从综述文章中获得从主题词表中获得主题词表是许多数据库对文献资料进行主题分类的依据。比较成熟的研究主题,可以从主题词表中查找。检索式表达语法不同文献类型的检索字段是不同的文献检索与利用-应用实例常用的可检索字段主题,SU=,检索范围包括题名、关键词、摘要题名,TI=,检索范围只有题名年,YE=(between),用于限制检索年代关键词,KY=,作者提供的关键词及机标关键词摘要,AB=,摘要或机标摘要作者,AU=机构,AF=(%)核心期刊,HX=Y……文献检索与利用-应用实例29核心期刊核心期刊是期刊中学术水平较高的刊物。起源:布拉德福定律、加菲尔德定律。在信息爆炸的年代在核心期刊中检索并阅读相关文献,可以用最少的精力获得最大的信息量。将科研成果发表在核心期刊上可以增加自己的研究成果被同行看到的几率。30中国科研评价常用核心期刊外文数据库中文数据库理工科SCIEEI中国科学引文数据库(CSCD)《中国科技期刊引证报告》《中文核心期刊要目总览》文科艺术SSCIA&HCI中文社会科学引文索引(CSSCI)图书馆主页——电子期刊——核心期刊查询系统文献检索与利用-应用实例专业检索常用算符文献检索与利用-应用实例名称符号说明应用举例逻辑算符(用于同一字段、不同检索词)*逻辑“与”,连接限定词,缩小检索范围TI=数字*版权查找篇名中同时含数字和版权两个词的文章+逻辑“或”,连接同义词,扩大检索范围TI=数字期刊+电子期刊查找篇名中包含数字期刊或电子期刊的文章-逻辑“非”,排除TI=汽车发电机-噪声查找篇名中含有汽车发动机但不含噪声的文章逻辑算符(用于不同字段间)and逻辑“与”,缩小检索范围TI=数字*版权andSU=学位论文or逻辑“或”,扩大检索范围TI=数字版权orTI%数字期刊not逻辑“非”,排除SU=数字*版权notTI=音像专业检索常用算符名称符号说明应用举例位置算符(跟在字段名称后)=精确检索AF=北京大学机构名称严格为北京大学,“北京大学数学系”等则不能命中%模糊检索(按字检索)AF%北京大学机构名称模糊含北京大学,包括北大各系,但不含“北京师范大学”位置算符(用于检索词间)/SENN同段,按次序出现,间隔小于N句FT='转基因/SEN0水稻'/NEARN同句,间隔小于N个词AB='转基因/NEAR5水稻'/PREVN同句,按词序出现,间隔小于N个词AB='转基因/PREV5水稻'/AFTN同句,按词序出现,间隔大于N个词AB='转基因/AFT5水稻'/PEGN全文,词间隔小于N段AB='转基因/PEG5水稻'$N检索词出现N次TI='转基因$2'检索式的形式:(SU=(A+B+C)*(D+E)*(F+H+G))and(TI=A+B)andYEbetween(2009,2012)即:同一字段内的逻辑运算符用*,+,-不同字段间的逻辑运算符用and、or、not括号必须在西文半角状态输入,字段名称必须大写或用汉字。检索效果评价指标检索效果:检索时产生的有效结果。检索效果直接反映了检索系统性能的好坏、检索式的好坏衡量检索效果的指标•查全率(recallratio)•查准率(precisionratio)理想的检索状态查全率(R)和查准率(P)都达到100%R100%:数据库中收录的全部相关文献均被检出P100%:检索出来的文献全部相关实际检索时是否可能??①查某篇文献:已知文献线索,获取原文。②查某个事实数据:查某种金属的熔点,某种材料的电阻。查找某类产品由哪些厂家生产,哪个牌号最好等。结果:查到:查全率和查准率均为100%。未查到:查全率和查准率均为0。1957年,英国Cranfield航空学院图书馆馆长、情报学家C.W.C1everdon领导下的研究小组进行了著名的Cranfield试验。试验结果证实:查找课题相关文献时,查全率和查准率呈反变关系。无论怎样调整检索策略和改进系统效率,都无法使P和R同时接近100%。0R-P曲线CADB查全率R查准率P关系曲线不可能的原因系统层面:存贮误差:对原始资料的内容特征揭示有失真,如分类、主题标引不当检索误差:计算机检索时严格字面匹配,而不是内容匹配,这与检索者所要求的内容相关有偏差用户层面:检索策略不合适:如数据库、检索词实际检索时通常采取折中的办法:在查准率可以接受的情况下,尽可能查全。科技查新通常要求查准率为40%-60%。常规处理办法极端情况1如某个人正在写一本书或撰写综述文章、或者着手一项长期研究计划,需要对相关的文献情况做全面了解,为了保证不遗漏任何相关的文献,他会要求查全率很高,而查准率可以很低。对应于R-P曲线中的A点。这意味着分离相关文献与无关文献需要更多的时间。0R-P曲线AB查全率R查准率P极端的情况2为跟踪研究动态,需要及时获得某一主题的最新文献。则可能不要求查全率,但期望有较高的查准率。对应于R-P曲线中
本文标题:文献检索与利用清华大学第四节课1-中文数据库检索式及检索技巧
链接地址:https://www.777doc.com/doc-2755529 .html