您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 第二次课: 2.4 计算机检索概述
Logo计算机检索定义计算机检索指利用计算机及相关设备进行的文献信息检索。信息检索技术正向两个方向迅速发展:一是在深度上提高管理和组织信息的能力传统信息检索向全文文本、多媒体、多载体、多原理等新型信息检索的发展.二是在广度上提高管理和组织信息的能力文献资源的网络化和分布化,面向Internet中浩瀚无垠的资源。Logo计算机信息检索系统构成服务器通信网络检索终端数据库Logo服务器服务器是检索系统的核心部分,在检索过程中需要处理大量的指令和数据,要求服务器必须有相当高的运算速度和处理能力,并且有相当大的存储能力服务器包括硬件和软件。硬件决定了系统的检索速度和存储容量,软件则充分发挥硬件的功能,进行信息的存储、处理、检索以及整个系统的运行管理。Logo通信网络、检索终端通信网络是联系检索终端与计算机的桥梁。可以通过端口访问主机检索终端是用户与检索系统传递信息进行人机对话的装置。主要指微机终端。Logo数据库数据库是一系列信息记录的集合,是检索系统中的信息源。数据库分为两大类:文献数据库:书目数据库,全文数据库非文献数据库:数值数据库,指南数据库,术语数据库,图像数据库Logo书目数据库只存储有关主题领域各类文献资料的书目信息,为用户鉴别和获得有关文献提供必要的文献属性和来源指示。数据来源于期刊论文、会议论文、研究报告、专利文献、学位论文、图书、政府出版物、报纸等各种不同的一次文献,是经过加工、压缩的派生性数据。书目数据库包括文摘索引数据库和图书馆目录数据库(机读目录)Logo全文数据库存储文献全文或其中的主要部分的源数据库。例:•中文--CNKI数据库•外文--EBSCO、OVID数据库Springer电子全文期刊Nature电子全文期刊特点:直接性,能直接检出原始文献或解决问题所需要的文献资料,不必进行二次检索详尽性,用户可以直接查到文献正文中的每一段、每一句、每个词。Logo非文献型数据库数值数据库(NumericDatabase):指专门提供以数值方式表示的数据(或包括其统计处理表示法)的一种数据库。准确的数据运算能力。生成用户所需的报表。有数据分析能力。Logo指南数据库指南数据库:存储的数据一般用来描述人物、机构、研究项目、产品或商品等资源。如人物传记数据库,公司名录数据库,基金指南库,产品指南库,软件数据库等Logo术语数据库术语数据库:指专门存储名词术语信息、词语信息以及术语工作和语言规范工作成果的数据库,各种电子化辞书也包括在内。如《中华人民共和国国家标准术语工作计算机应用数据类目》Logo图像数据库图像数据库(GraphicsDatabase):指用来存储各种图像信息及有关文字说明资料的一种源数据库,主要应用于建筑、设计、医学影像、图片或照片等资料类型的计算机存储与检索。Logo.逻辑“与”用“and”、“*”或者空格表示。在网络搜索引擎中习惯用空格代替“and”。【实例】检索“中国人民政府”这个网站,可以输入“中国*政府”、“中国and政府”、“中国政府”等。Logo.逻辑“或”用“or”、“十”或逗号表示。在网络搜索引擎中习惯用逗号代替“OR”。【实例】在搜索引擎中输入“计算机,多媒体,Windows98”则查询至少包含“计算机”、“多媒体”、“Windows98”三者之一的信息。Logo.逻辑“非”用”not”或”-”表示【实例】输入“automobilenotcar”,就要求查询的结果中包含automobile(汽车),但同时不能包含car(小汽车)。在搜索引擎中输入“电视台-中央电视台”,查询结果不包含“中央电视台”。Logo位置检索算符常用的位置检索算符有以下几种:1.邻近位置检索算符(W)【实例】Powder(W)Coating表示这两个单词相当于一个组合词。2.邻词位置检索算符(nw)【实例】Fluidizedbedreactor(流化床反应器)可用Fluidized(1W)reactor检索,中间可存在1个词。Logo【实例】用《EBSCO》数据库检索税收改革文献,检索式“taxW8reform”表示tax一定在前,距离reform最多是8个词汇,因此可以检索出“taxreform”,不能检索出“reformofincometax”。Logo句子位置检索算符(S)A(s)B表示A和B必须同时出现在记录的同一个句子或短语中,但次序可能随意改变,A与B之间可以有若干个其他的词。有的数据库用“(N)”表示(S)。Logo后截词后截词就是保持检索词的前部分的检索。中文数据库里面习惯称为“前方一致”。【实例】输入“tele*”,将检索出telecommunications、telecom、telephones、television等开头字母为tele的词。Logo前截词【实例】如果要把含有“computer”、“microcomputer”、“minicomputer”这三个词的文献全部检索出来,在多数外文数据库只要输入“*computer”即可。中文数据库里面习惯称为“后方一致”。Logo中间截词【实例】在多数外文数据库输入“B?nard”可命中Banard和Bénard。【实例】在多数外文数据库输入“sul*ate”,检索结果将包含“sulphate”、“sulfate”等。Logo前后截词中文数据库里面习惯称为“中间一致”。【实例】在多数外文数据库输入“*computer*”能检出含有“computer”、“computerized”、“computerization”、“computers”、“microcomputer”、“minicomputer”这些词的全部文献记录。Logo字段揭示及限制算符字段揭示符用文字或字母来表述某字段所代表的含义。如字段揭示符“AUTHOR”或“作者”或“AU”表示作者字段字段限制符用来连接字段揭示符和检索词的算符,表明检索词隶属于某字段。如Proquest数据库中,检索式AU(JOHN)中,()为字段限制符,将检索词JOHN限定到AU字段中,即检索出的文献的作者是JOHN。相同的检索词在不同的字段中检索到的结果不同Logo常有的字段:题名字段TI=Title文摘字段AB=Abstract叙词字段DE=Descriptor自由词字段ID=Identified著者字段AU=Author著者机构字段CS=CorporateSource刊名字段JN=Journal出版年字段PY=publicationYear文献类型字段DT=DocumentType语种字段LA=LanguageLogo例:检索式computer/ti表示在题目中查找含有computer一词的文献例:检索式Cs=Pekinguniversity表示检索著者单位为北京大学的所有文献Logo字段揭示及限制算符【实例】用《中文科技期刊数据库》检索机械产品采用计算机辅助设计的论文。用不同字段作为途径,如下所示:选择”u=任意字段”输入“计算机辅助*产品”,查出12篇;选择“t=题名”输入“计算机辅助*产品”,查出2篇;选择“k=关键词”输入“计算机辅助*产品”,查出2篇;检索入口选择“c=分类号”输入“机械产品”的分类号“TH122”年限设定-查到243条。Logo选错了字段,还可能导致检索失败。例如:某学生检索课题“纳米技术在除螨功能纺织品中的应用”,在检索中国国家知识产权局的专利时,无论选择“名称”还是“摘要”字段,输入:纳米and螨虫and纺织品,检索结果都是零。后来选择“名称”字段输入“纳米”,选择“摘要”字段输入“螨”,选择“主分类号”字段输入国际专利分类号“D部——纺织与造纸”的纺织类的“织物的处理类”分类号“D06”,检索结果是一篇名为《一种纳米防螨抗菌针织服装的生产工艺》。造成漏检的原因是事先不知道该专利的准确名称,没有提取准确的检索词,也没有考虑发挥不同字段的协同作用。Logo.括号括在其中的操作符先起作用。2.引号引号内的检索项以整体形式出现。3.个别数据库使用的特殊符号某些搜索引擎使用加号(+)表示该单词必须出现。Logo【实例】在某些搜索引擎中输入“电脑+电话+传真”就表示要查找的内容必须要同时包含“电脑、电话、传真”这三个关键词。个别数据库例如“国研网”、山东标准网使用“&”代替“and”;欧洲专利局光盘数据库的“without”、美国专利商标局数据库的“andnot”就是通用的“not”。Logo注意事项1.正确理解数据库检索标识2.确保检索策略与课题的匹配性1)检索项与检索词的正确匹配2)检索式中各个检索项或检索元素之间的逻辑关系3)课题的隐含主题概念的挖掘Logo正确表达课题不能总是简单地把课题名称当成文献的题目直接检索。用《中文科技期刊数据库》检索有关“法律的渊源”的期刊论文,有的题目是《……法制的渊源……》,而关键词是“法律”,所以最好选择关键词字段而不是标题字段输入“法律*渊源”。Logo【实例】某专利申请的主题涉及商店待出售衣服上防止衣服被偷窃的装置,该装置由两个从衣服正反面锁合在一起的部件组成,其中一个部件上有针状结构,另一个部件上有将针啮合住的机构,欲将这两部分分开时,如果不用特殊工具,机构中的装有液体的小容器就被损坏,液体流出,污染衣服。要检索这类专利信息,如何表达检索课题的意图?Logo【题解】课题不能简单地表达为“防止衣服被偷窃的装置”,而要表达为关键词“防盗”(theftproof)、“液体”(liquid)与“衣服”(cloth)和国际专利分类号例如物理部
本文标题:第二次课: 2.4 计算机检索概述
链接地址:https://www.777doc.com/doc-3376129 .html