您好,欢迎访问三七文档
搜索引擎使用技巧——《现代信息检索》和《科技信息检索》的结晶搜索之前先思考•在你使用搜索引擎搜索之前,应该先花几秒种想一下,我要找的东西网上可能有吗?如果有,可能在哪里,是什么样子的?网页上会含有哪些关键字?这次搜索,你应该使用新浪还是搜狐?Google还是百度?分析你的需求,比较不同搜索引擎的强项和弱点,然后为这次搜索选择最适合的搜索工具。选择搜索引擎1、搜索引擎的收录范围。使用搜索引擎首先应该了解它收录的范围是什么,这样才能知道在这里是否能找到自己所需的资料。全球性网站虽然收录的范围很广,但针对某一范围而言,往往不如本要范围的搜索引擎更为丰富。搜索引擎的收录范围包括:(1)地域范围:一般大型网站均面向全球(如:YAHOO!),一些中小型网站一般收录某一区域的信息(如:亚洲网路主要收录亚洲地区网站)。(2)语言范围:常见有简体中文(GB码)、繁体中文(Big5码)、英文。(3)网站类型范围:大多数搜索引擎提供WEB页搜索,但也有一些搜索引擎提供FTP、BBS、新闻组等检索内容。(4)专业范围:有些网站专门收录某一主题、某一行业方面和信息。选择搜索引擎2、明确它的设计目的和发展走向,有的专用于检索WEB信息,有的专用于检索Usenet信息,有的针对商业需要设计,使用时确认所选引擎是否能够满足检索需要。3、其他相关说明。在帮助信息中查找本引擎的操作方法,使用规则及算符说明和它的特色服务。这些信息是用户进行网络信息资源查询所必须具备的知识。国外搜索引擎:搜索目标(英文)搜索引擎/目录索引一般资料Google资料涉及非常冷僻的领域AllTheWeb特殊资料InfoSeek/WebCRawler等产品或服务Yahoo/Overture国内搜索引擎搜索目标(中文)搜索引擎/目录索引一般资料Google古汉语(诗词)资料百度(有独到之处)产品或服务搜狐、新浪(质量高)、网易(较全)检索提问式的构造•一是检索词的选择•二是检索词的组配连接一、关键词的选择—搜索引擎检索的灵魂•要有足够多的检索词,借鉴方法:•5W1H(whatwhowherewhenwhyhow)•检索策略信息检索策略-------联机检索策略•积木型:把用户的检索请求剖析成若干个不同的概念面,先分别对这几个概念面进行检索,并在每个概念面中尽可能全和多的列举相关词、同义词、近义词,并用布尔算符“OR”连接成子检索式;然后再用适当的布尔算符把所有子检索提问式连接起来,构成一个总检索式。•引文珠形增长:从已知的关于检索问题的少数几个专指词开始检索,以便至少检出一篇命中文献或一条相关信息,然后审阅这批文献或信息条目,从中选出一些新的相关检索词,补充到检索提问式中去。•逐次分馏:先确定一个相当大的范围广的检索初始对象集合,然后一步步提高检索提问式的专指度,缩小命中结果集合,得到数量适宜满意的结果。•最专指面优先:用户在检索时,首先选择从检索课题中最专指的概念面入手,浏览结果后如发现检出的文献相当少,通常就不再把其他概念面加入。选择检索词注意事项:①同义词(缩写、全称、简称、学名、俗名、简繁体、不同语言说法、不同地区说法、不同时代说法、别称、大小写、通假字)②注意选择检索课题的核心概念,排除无关概念,合并重复概念,以简化检索式。③避免使用冷僻词汇④注意阅读搜索引擎的规则,了解引擎的停用词和常用词,等。二、检索词的连接组配1、使用布尔检索布尔算符主要有⑴“AND”:连接的两个关键词都必须出现在检索结果中。某些检索工具用符号“+”代替AND。例如,输入“computerandbook”,它要求查询结果中必须同时包含computer和book。⑵“OR”:连接的两个关键词必须有一个出现在检索结果中,百度用“|”代替。例如,输入“computerorbook”,就要求查询结果中可以只有computer,或只有book,或同时包含computer和book。⑶“NOT”:紧跟在“NOT”后的关键词不出现在结果中。某些检索工具用“ANDNOT”或者“—”代替。例如输入“automobilenotcar”,就要求查询的结果中包含automobile(汽车),但同时不能包含car(小汽车)。在实际的使用过程中,你可以将各种逻辑关系综合运用,灵活搭配,以便进行更加复杂的查询。当两个关键词用另外一种操作符连在一起,而你又想把它们列为一组时,就可以对这两个词加上圆括号(),以改变或调整各项检索项的运算优先次序。2、使用双引号用()给要查询的关键词加上双引号(英文状态),可以实现精确的查询。例如在搜索引擎的文字框中输入“电传”,它就会返回网页中有“电传”这个关键字的网址,而不会返回诸如“电话传真”之类网页。3、使用截词符截词符的作用是对单元检索词进行加工修饰,使其功能更完善。例如,使用截词符可以解决一个检索词的单复数问题,词干相同而词尾不同的问题,以及英美单词拼写差异的问题等。截词符在不同系统中有不同的规定符号。也并不是所有的搜索引擎都支持截词检索。4、位置算符表示连接的各个单元检索词词间位置关系的符号,例如,使用位置算符可以限制两个检索词在文献中出现的先后顺序、间隔的距离等。如“W/N/S/F/L/C”5、使用元词检索(高级检索中的一些特殊功能)大多数搜索引擎都支持“元词”(metawords)功能,依据这类功能用户把元词放在关键词的前面,这样就可以告诉搜索引擎你想要检索的内容具有哪些明确的特征。例如,你在搜索引擎中输入“title:清华大学”,就可以查到网页标题中带有清华大学的网页。在键入的关键词后加上“domain:org”,就可以查到所有以org为后缀的网站。其他元词还包括:image:用于检索图片,link:用于检索链接到某个选定网站的页面,URL:用于检索地址中带有某个关键词的网页,filetype:文件格式。6、区分大小写这是检索英文信息时要注意的一个问题,许多英文搜索引擎可以让用户选择是否要求区分关键词的大小写,这一功能对查询专有名词有很大的帮助,例如:Web专指万维网或环球网,而web则表示蜘蛛网。检索过程中遇到的问题1:错别字经常发生的一种错误是,你输入的关键词含有错别字。笔者所做的统计表明,常有大量的错误搜索,光一个谢霆锋就有“谢霆锋”、“谢庭锋”、“谢霆峰”、“谢廷锋”、“谢庭峰”、“谢廷峰”6种查法,还有什么“星际争吧”、“以德制国”之类的,这样的关键词能搜索到什么有用资料吗?所以每当你觉得某种内容网上应该有不少、却搜索不到结果时,你应该先查一下是否有错别字2:关键词太常见搜索引擎对常见词的搜索存在缺陷,因为这些词曝光率太高了,以至于出现在成百万网页中,使得它们事实上不能被用来帮你找到什么有用的内容。比如,搜索“电话”,有无数网站提供跟“电话”相关的信息,从网上黄页到电话零售商到个人电话号码都有。所以当搜索结果太多太乱的时候,你应该尝试使用更多的关键词或者减号来搜索,不使用过于通用的词汇来搜索,设计一个类似“上海常用电话”这样特殊的搜索关键词,会给你真正有用的结果。当然,如果你想找的是一串汽车网站或一串MP3网站,那么用“汽车”、“MP3”搜索就是正确的3:多义词要小心使用多义词,比如搜索“Java”,你要找的信息究竟是太平洋上的一个岛、一种著名的咖啡、还是一种计算机语言?搜索引擎是不能理解辨别多义词的。最好的解决办法是,在搜索之前先问自己这个问题,然后用短语、用多个关键词或者用其他的词语来代替多义词作为搜索关键词。比如用“爪哇印尼”、“爪哇咖啡”、“Java语言”分别搜索可以满足不同的需求4:不会输关键词,想要什么输什么•搜索失败的另一个常见原因是类似这样的搜索:“现代爱情故事•歌词”、“信息早报在济南发行情况”、“铃羊车的各种图案”、“上海到•成都列车时刻表”。网友错把搜索引擎当成是听话的服务员了,其实搜索引擎是很机•械的,当你用关键词搜索的时候,它只会把含有这个关键词的网页找•出来,根本不管网页上的内容是什么。而问题在于,没有一个网页上会含有“现代爱情故事歌词”和“上海•到成都列车时刻表”这样的关键词,所以搜索引擎也找不到这样的网页。•但是真正含有你想找的内容的网页,应该含有的关键词是“现代爱情故•事”、“歌词”,“上海”、“成都”、“列车”、“时刻表”,所以你应该这样•搜索:“现代爱情故事歌词”、“信息早报济南发行”、“铃羊车图案”•“上海成都列车时刻表”。5:在错误的地方搜索•搜索引擎从抓取网页、解析、索引•到提供检索是有一个周期的,各搜索引擎的信息滞后•周期从一周到一月不等,所以找最新内容应该去看新•闻,用搜索引擎是找不到最新内容,只能找到一个星•期或一个月以前的内容。另外,搜索引擎对动态内容•,如:论坛、数据库内容,以及带frame结构的网页检•索能力较弱,所以这类信息也不适合用搜索引擎搜索,•而是应该去相关的网站寻找,当然,寻找相关网站的•任务搜索引擎是当仁不让的。当用户对检索结果不满意时,可以适当调节检索式中的泛指词、专指词、和相关词之间的数量比例及逻辑组配关系来改善检索效果。例如,对需要较高查全率的检索项目,可从扩检入手。方法如下:1、降低检索词的专指度,词的上位概念和下位概念要充分应用,词的近义词及相关词补充到检索式中,用“OR”连接。2、减少逻辑“与”的运算,丢掉一些次要的或者太专指的词。3、去掉某些条件限制,如文献格式,语言,时间等。4、调整位置算符,(W)—(F)5、进行截词检索,具体采用后截断、前截断等不同方式。对于需要较高查准率的检索项目,一般在查全率的基础上在进行缩检。方法如下:1、减少同义词和同族相关词的使用。2、提高词的专指度,增加或换用下位词或专指度高的自由词或直接使用短语进行检索。3、增加限制概念,采用逻辑“与”连接检索词。4、增加条件限制,将检索词限定在某个或某些字段,或运用位置算符限定词间顺序。或规定文献格式、语言等。5、使用逻辑“非”算符,排除无关概念。6、进行第二次检索,或对检索结果进行后处理,例如聚类、挖掘。另外,还需要对检索项目和引擎进行综合分析,才能灵活运用。在搜索引擎的使用过程中,需要注意和强调的问题:1、由于网络资源的动态增长和海量规模,当前任何一个搜索引擎的数据库收录的范围都非常有限。为此,进行信息查询时,一个搜索引擎不能得到很满意的结果,应换用其他的搜索引擎,或考虑使用元搜索引擎,以扩大查询范围,提高查全率。2、搜索引擎的搜索结果一般比较庞大,还会存在大量重复、无效的虚假的垃圾信息,为此,当用户对搜索结果进行选择和判断时,应注意使用搜索引擎的一些新型后处理服务功能,例如对搜索结果的排序优化、联机聚类与可视化输出、检索结果过滤甚至挖掘。3、注意使用分类目录浏览方式,特别是在用户查询需求模糊,无法通过关键词进行检索,这时通过目录浏览往往会发现一些线索,从而使查询任务完成。浏览方式和关键词检索方式有机结合起来,事半功倍。That’sall!
本文标题:搜索引擎使用技巧
链接地址:https://www.777doc.com/doc-3380459 .html