您好,欢迎访问三七文档
计算机检索1.信息素养(信息素质、信息能力):作为具有IL(informationliteracy)能力的人,必须能够充分地认识到何时需要信息,并有能力去有效地发现、检索、评价和利用所需要的信息,从而具有终身学习的能力,总能够为任何任务和决策找到所需信息。2.信息检索广义:指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。包括存储和检索两个过程。狭义:从信息集合中找出所需信息的过程。信息查找(InformationSearch,InformationSeeking)2.1信息现状分析1)信息爆炸导致文献量急剧增加,内容相互渗透,语种增多;文献分布异常分散;文献寿命愈来愈段;2)由于条件限制,人们吸收和利用信息的能力并未得到相应的提高。3.检索的作用1)促进智力资源的开发;2)协助管理者做出正确的决策;3)帮助科研人员借鉴前人的研究成果,避免重复劳动;4)信息检索是知识更新的手段。4.数据库类型(1):作为图书馆数字资源的数据库特指为科学、教学、学习所需各种参考资料的集合,以数据库的形式管理和利用。自建数据库:馆藏目录(OPAC),本校学位论文数据库。商业性数据库:数据库商、出版商和其他机构以商业化方式提供的各种电子资源,图书馆需要支付一定的费用购买数据库的使用权再提供给一定的读者群。免费数据库:开放获取资源、机构典藏和其他免费的网络资源。5.数据库类型(2)从收录文献的内容分,有综合性数据库和专业性数据库之分;从收录文献的类型分,有图书数据库、期刊数据库、学位论文数据库、报纸数据库、会议文献数据库、专利文献数据库、标准数据库等;从提供文献的形式分,有全文数据库、文摘数据库、引文数据库;各数据库举例:专业数据库:PetroleumAbstract(PA)、EnCSciFinderSchoiar(CA)综合性数据库:读秀、Scopus、EI、SCI特定文献类型,如图书、期刊、学位论文等:超星、EIsevierScienceDirect、PQDT全文数据库:CNKI、维普、SPE摘要性数据库:EI、PA引文数据库:WebofScience、CSSCI(中文社会科学引文索引)6.ScienceCitationIndexExpanded(SCI-E)是个什么样的数据库?它是ISI检索平台中WebofScience核心合集中的一个子库它是一个摘要型数据库它是一个引文数据库它是一个期刊数据库它收录的学科范围包括科学、技术的各学科7.查文献应该如何选择数据库?学科专业:有专业型数据库时,首选专业型数据库;数据量:选择数据量大的;文献类型:根据研究的需要。如果仅需要某种文献,最好选择该类型的子库;检索功能:准确性高、易用、检索结果的处理能力;分析功能第三章信息资源的分类8.信息存贮载体:印刷型、缩微型、声像型、机读型9.根据加工程度划分零次文献:口头信息、未公开发表的文字资料(手稿、书信、笔记等);时效性强;大量而无序;一次文献:期刊论文、专利文献、科技报告、会议录等;研究人员最终索取的文献;二次文献:检索工具:如SCI、EI、CA、PubMed/Medline三次文献:选用大量有关的文章,经过综合、分析、研究而编写出来的文献;如:综述、评论、评述、进展、动态等;研究人员最终需要的文献。科研人员与科学信息的获取和利用:研究人员的文献平台可以由二次文献作为入口,满足整体的需求;然后,通过这个入口来获取有用的高质量的全文期刊(一、三次文献)来满足纵深对的研究需要。10.根据文献编辑出版的特征和范围划分(1)1)科技图书Books(Monograph,Anthology,Textbook,Referencebook):内容系统成熟可靠,新颖性较差;学习,教育之用。2)科技期刊Periodical(Journal,magazine,serial):数量大,覆盖面广,内容新颖,及时;交流,影响广泛,信息价值高。3)报纸(Newspaper):出版周期更短;获取实事性、政策性信息。4)政府出版物(GovernmentPublications):源自官方、权威、可靠、价廉;可获取政策性、法规性及科技信息。5)科技报告(Sci/TechReport):反映前沿科技、内容新颖、有密级控制。如:美国政府四大科技报告:PB,AD,NASA,DOE报告。6)专利文献(PatentDocument,Patentspecification/bulletin/aids):类型有:专利说明书、专利公报、专利分类表、专利文摘等检索工具。反映新的技术发明,是重要的技术、经济信息源。7)会议文献(Conferencepaper,Proceedings):会议论文集,回忆录,会议资料等;反映最新成果,最新动向,高水平,前沿发展动态。8)学位论文(Dissertations\Thesis);内容专深,非卖品,有较高学术参考价值。9)标准文献(Standards):反映成熟技术,掌握技术政策,技术水平,可供研究新产品,改造老产品,改进工艺和操作水平是借鉴。10)产品资料:形象、直观、新颖、可了解工业水平、产品发展、市场动态等。11)广告(Advertisement):可及时把握竞争对手最新推出的产品品种,市场卖点。准确掌握个地区市场的广告竞争态势。12)技术档案和图纸:技术性,适用性,保密性。11.检索语言:根据检索需求而编制的检索系统存储与检索共同使用的人工约定语言。分类:体系分类语言、标题词语言、关键词语言、叙词语言。12.检索途径:又称检索点,指利用信息的各种内外特征,作为检索出发点,从不同角度来检索信息。有:分类(Classified):所属学科分类主题(Subject):所属主题内容、关键词著者(Author):团体著者(CorporateAuthor)名称,题目(Title)代码(Code)13.基本运算符(1)逻辑算符“与”:and或*例:telecommut?andproductiv?逻辑算符“或”:or或+例:computerormicrocomputer逻辑算符“非”:not或—例:aspartamenotbeverage14.基本运算符(2):截词符用于解决一些词干相同、词义相近、但词尾或词头不一致的派生词(如有同一词根派生出的名词、动名词、动词、形容词、副词等),或名词的单、复数形式,或痛一次的英美不同拼写形式等词的一次输入。PQD平台的截词符用?、*和$表示。截词符?Nurse?—nursed/nursesad???—added/adult/adopt用于替换某个字词中间或结尾的任何一个字符,不能代表没有字符。截词符*control*—control/controlled/controlling代替0-10个字符截词符$$5beat—Upbeat/offbeat/heartbeat限定截词符用$n表示,代替0-n个字符。15.基本运算符(3):位置算符(P/n、N/n)用于限定词与词之间的位置关系,以提高查准率。当检索词为词组形式时,或两个检索词之间可能被禁用词或标点符号隔开时,均应使用位置算符。P/0两个单词中间有一个空格或一个字符,在文献中出现的前后位置不能互换。PolarP/0embedded可检索到:polar-embedded或polarembeddedP/1两个单词中间可能有0-1个单词,在文献中出现的前后位置不能互换。位置算符P/n与位置算符N/n的用法近似,区别在于前后单词是可以互换的。16.PQD检索词自动匹配在PQD中检索时,系统会自动匹配单词的单复数,英美拼写变体,形容词比较级最高级等形式。17.短语检索:“”(双引号检索短语)在PQD中可把短语放在引号内进行精确短语检索,但这种检索方式不能自动匹配。在PQD中,空格默认为逻辑算符and。18.字段检索格式:字段名(检索词或检索式)AU(smith)andTI(food):检索标题含有food,作者含有smith的文章。多个字段检索时,字段与字段之间用逗号隔开AB,TI(food):检索标题含有food或者摘要含有food的文档。PQD中,检索式常用限制字段为TI,AB,SU,IF。PQD中的主题词(SU)字段是系统标引的独立字段。19.检索策略:指为实现检索目标而制定的检索计划和方案。检索式是检索策略的具体体现,是指计算机检索中用来表达用户检索提问的逻辑表达式,通常由检索词和各种逻辑算符、截词符、位置算符以及系统规定的其他连接符号等构成。20.检索的基本步骤1)分析检索课题,明确检索要求,确定检索的主题内容、范围等2)确定检索概念3)选择表达概念的检索词选择所有不同的能够表达检索概念的词使用截词检索各种词尾变化的词使用位置算符指定词组或词间的相对位置关系4)使用逻辑算符组配检索概念,拟定检索表达式5)选择恰当的数据库6)上机检索21.获取全文的方法全文链接按钮、全文数据库、馆际互借、图书馆文献传递、免费全文网站、提供免费全文的期刊,作者E-mail联系或作者主页。22.检索策略的优化方法(1)扩大命中文献量的方法1)选择其他同义词、相关词、上位词2)去掉一个不太重要的检索信息3)将限制严谨的位置算符改为较宽松的位置算符,或通过and算符代替位置算符4)取消某些限制过严的后缀符、限制符等5)增加检索途径,将主题途径与非主题途径结合起来使用6)利用截词技术,检索所有相同词干的词7)用E指令扩词以核实拼写8)选择其他数据库进行检索23.检索策略的优化方法(2)缩小命中文献量的方法1)提高检索式的专指度,增加或换用下位词和专指度较强的词2)增加一个检索概念3)将检索式中的and算符改为位置算符;或将较宽松的位置算符改为更严谨的位置算符4)使用后缀限制,将检索词限制在基本索引的“重要”字段中,如规范词字段或题目字段5)用辅助索引的某些字段与主题索引组结合限制检索范围6)截词使用不当24.三大检索系统概况SCI(ScienceCitationIndex)SCI-E(ScienceCitationIndexExpanded)科学引文索引SSCI(SocialScienceCitationIndex)社会科学引文索引A&HCI(Arts&HumanitiesCitationIndex)艺术与人文引文索引CPCI(ConferenceProceedingsCitationIndex)CPCI-S(ConferenceProceedingsCitationIndex-Science)科学会议CPCI-SSH(ConferenceProceedingsCitationIndex-SocialScienceCitationIndex)社会科学与人文艺术会议EI(TheEngineeringIndex)工程索引25.三大检索系统收录质量区别SCI最能反映基础学科研究水平和论文质量检索系统收录的科技期刊比较全面集中各学科高质量优秀论文的精粹成为世界科技密切注视的中心和焦点CPCI、EI这两个检索系统评定科技论文和科技期刊的质量标准相对要宽松CPCI是一种综合性的科技会议文献检索刊物,该检索工具收录包括自然科学、技术科学以及历史与哲学等,覆盖的学科范围广,收录会议文献齐全,而且检索途径多,出版速度快。易成为了检索全世界正式出版的会议文献的主要的和权威的工具。26.临近算符NEAR/x:NEAR代表所链接的两个词之间的词语数量小于等于N,默认的使用Near的缺省值是15。SAME:要求两个检索词是在一个检索字段中。YaleSAMEhosp27.利用WOS强大的分析功能WebofScience数据库中可以对检索结果按照以下方式进行研究:按照作者分析:了解某个研究的核心研究人员是谁;按照国际和地区分析:了解核心研究国是哪里;按照文件类型分析:了解该研究通常以什么途径发表;按照机构名称分析:了解有哪些机构在从事这项研究;按照语种分析:了解该研究是以什么语种发表的;按照出版年分析:了解该研究的发展趋势;按照期刊标题分析:了解该研究通常发表在哪些期刊上;按照学科分类分析:了解该研
本文标题:信息检索知识点
链接地址:https://www.777doc.com/doc-5149138 .html