您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 主流搜索引擎使用方法资料
Google及其它搜索引擎的高级使用成俊颖主要内容Google搜索引擎Baidu搜索其它Google检索规则检索运算符语法结构搜索服务检索规则在使用搜索引擎时,所选择的检索词对于是否能够找到相关信息有着举足轻重的作用,所选用的检索词不但关系到真正需要的内容是否被检索到,也关系到被检索到的内容依据什么来进行排序。Google的检索是以分析网页内容和网页链接为基础的,因此,我们所选择的检索词要尽可能地出现在被检索页面的内容中。检索规则And规则:在Google的检索规则中,最基本的一条是默认And规则,即当你输入多个检索词之后,Google默认为要检索所有的包含所有检索词的网页,它们之间为And连接。我们使用这个And规则,通过添加更多的检索词,来缩小检索范围,达到提高查准率的目的。例如,搜索“分词”和“关键词”,则结果如下:可以看到,Google将默认搜索同时带有关键词和分词的网页。检索规则排除常用词规则:在Google的检索规则中,有些常用词如“的”或者“of”等这些词是不被当作检索词的,而被忽略掉。因为这些词遍布于每一个网页之上,因此加上它们作为检索词,不但不能缩小检索范围,反而使得搜索引擎花费更多的时间。因此就称此为排除常用词规则。检索规则不区分大小写规则:这些规则在我们检索国外文献的时候,或者使用拉丁语系做检索时特别需要注意。Google对于检索词中的大小写是完全不做区分的,这个规则的设置是为了改善检索结果,因为利用这样一个规则,就可以检索到包含该词的所有网页,避免了因为大小写不规范而造成的在查全率上的损失。例如,搜索“ARCHER”,其结果如下:可以看到,对于大写的“ARCHER”,Google并没有考虑其大小写因素。检索规则排除标点符号规则:Google并不认为标点符号具有与文字一样的重要地位,因此Google会忽略检索之间绝大多数的标点符号。但是对于单引号和连字符而言,它们是不被省略的。Google一般是检索带有该符号的内容,同时也检索省略后的内容。例如,搜索“你好吗?我很好。”其结果如下:可以看到,虽然结果中也有同样的标点符号,但是它并不是以关键词予以对待的。检索规则检索词的词序和邻近规则:在Google中,检索词的排序方式对于整个检索式具有重要的影响,它将首先匹配按照检索式给出的次序进行搜索。同时它也将优先匹配检索词相互邻接的网页。例如,转换关键词“你”、“我”、“他”的顺序,则结果如下:上述两图的对比,就可以看出,关键词的位置对检索结果也是有影响的。检索运算符双引号“”:使用双引号可以界定多个检索词,只检索按照引号内词序一起出现的网页。用双引号可以检索一些特定的字句,并且可以解除对常用词不检索的规则。用双引号检索专指性的内容是最为常用的做法。例如,故意将语句“tobeornottobe”写错,进行是否将双引号的对比搜索,其结果如下:可以看到前者没有使用双引号,搜索结果仍然将“tobeornottobe”这一语句作为优先考虑,而后者,使用了双引号,则强制检索了双引号内的内容,而没有将语句加以考虑。检索运算符检索运算符通配符*:在上面的章节中曾经提到,在检索时,如果只知道某字句的一部分,可以通过通配符来进行检索。在Google中,使用星号作为通配符运算符,表示匹配用它代表的任何词。例如,搜索“I*Ineversawthesunshine”这一歌名,其结果如下:从图中可以看出,Google将搜索过程中省略的“wish”搜索出来了。检索运算符运算符OR:在一般默认情况下,Google将And作为默认运算符,查找包含全部检索词的网页。而使用OR则表示,查找包含检索词中任意一个的网页。即提高查全率。在这里有一点要注意,在这里要区分大小写,因为Google将小写or看作是普通检索词,而将大写的OR才看作是运算符。一般,我们通过使用OR这个运算符,可以避免因为拼写错误或者同义词而造成的漏检。例如,搜索人名容易写错的“凌波丽”和“绫波丽”,其结果如下:可以看到,现在两个名字都被搜索了,这样就避免了因为拼写错误而可能造成的漏检。检索运算符运算符“+”:表示包含该运算符后面的词。在一个检索词之前,直接放一个“+”号(不含空格),即直接告诉Google,该检索词必须出现在返回网页中,作为检索结果出现。因此,这个检索词也可以被用来要求Google强制检索出被排除的常用词。例如,同样搜索“tobeornottobe”,使用了运算符“+”在“or”前,则结果如下:可以看到,这次Google不再提醒小写“or”是忽略词了。检索运算符运算符“-”:表示不包含该运算符后面的词。在检索过程中,将“-”放在检索词之前(不含空格),即告诉Google检出不含该检索词的网页。这个运算符通常使用在你所检索的内容中,含有某个检索词的干扰项特别多的情况之下,可以起到精炼检索过程的作用。值得注意的是,在一个检索式中,该运算符可以多次使用,但不能够单独使用。例如,我想搜索申花电器而不是足球队的消息的时候,搜索“申花-足球”,其结果如下:可以发现,搜索列表的第一个就是申花电器,而不再是申花足球队了,当然,同时也可以看出,Google的新闻搜索不支持该运算符。检索运算符同义词运算符“~”:一般在检索英语时会使用到,中文暂时不支持该运算符。将该同义词运算符放在某检索词的前面(不含空格),是指让Google检索该词以及该词的同义词。该运算符通常适用于具有较为广泛含义的词或者具有多种不同含义的事物,比如说缩略语、俚语、概念或者形容词等,可以起到改善检索结果的作用。例如,搜索“sword”,其结果如下:可以看到,Google不仅搜索了“sword”,也搜索了它的同义词,如“katana”语法结构使用Google所提供的特殊的语法结构,能够帮助用户缩小检索范围,更有效地找到所需要的内容。在一般情况下,Google将整个网页进行收录和索引,通过专门的语法结构,可以让用户搜索网页的某些特定部分或者特定信息。语法结构Intitle:将搜索范围限制在网页的标题内。即检索词仅匹配(在网页标题中)字词出现在检索结果的网页的链接内和打开网页后浏览器的标题栏内。其变体allintitle指搜索所有题目中包括所有关键词的网页,即在每个检索关键词前加一个intitle语法,所有的词都出现在标题内才匹配。例如搜索“十二国记”,其结果如下:可以看到,标题中一定会含有搜索词。语法结构Intext:只在网页的正文中检索关键词,即忽略超链接文本、URL以及题目等。多使用于所要检索的内容为超链接文本、URL内经常出现的内容,而将其忽略掉,以提高查准率。其变体为allintext,用法同上。例如,搜索“亚瑟王”,其结果如下:可以看到,标题中的“亚瑟王”并没有作为关键词予以考虑,而是考虑了文本中的关键词。语法结构Inanchor:在页面的链接锚点进行搜索,即在一个链接的描述文本内进行检索。其变体为allinanchor,用法同上。例如想搜索客服网页,则键入“inanchor:”support”,其结果如下:点击进入后包含support的连接页面。语法结构Site:将检索局限在特定网站或者网域内,即将搜索限制在某个特定站点或者顶级域名内。但是值得注意的是,site语法不适合于子页面内的内容,在这个时候,应该使用inurl语法。例如想搜索新浪网中关于歼十的新闻,则键入“歼十site:sina.com.cn”,其结果如下:可以看到,搜索结果局限于新浪网中。语法结构Inurl:将搜索结果限制在URL或者网站页面上,他可以查询网站的子目录。一般通过这个语法,我们可以查找某些特定的内容页,如帮助页,也可以查找特定的文件,如音乐或者视频文件。例如,搜索歌曲“后来”的mp3,则键入“inurl:mp3后来”,其结果如下:语法结构Link:检索所有链接到某个特定URL的页面列表。例如,搜索所有链向新浪的链接,其结果如下:语法结构Cache:帮助用户查找Google的网页快照。网页快照的作用是帮助我们查找某些原链接处不存在,或者更换了内容的网页。对于我们查找过去的一些页面是很有帮助的。当然,可能有些地方不支持网页快照。例如,用“cache:wikipedia.org”返回的结果如下:语法结构Filetype:检索特定类型的文件,即搜索后缀或者文件的扩展名。在我们寻找特定格式的内容的时候,这项语法是必不可少的。例如,仅搜索关于Google的pdf文件,结果如下:语法结构Daterange:查找在一定的日期或者一定的日期范围内,Google索引的网页。即该语法只关注被Google收录的时间,而不关注网页创建的时间。语法结构Related:检索与某特定网页类似的网页。这在搜寻相关内容或者具有类似功能的网页的时候,非常有帮助。例如,搜索Google的相关页,其结果如下:可以看到,返回的结果,都是搜索引擎类网站。语法结构Info:检索有关特定网页的信息,获得关于该URL更多信息的页面列表,包括指向该网页的网页快照、类似网页、链接到该URL的所有网页的列表、该URL相关的页面列表以及含有该URL的页面。例如,搜索关于新浪的信息,其结果如下:语法结构Define:对检索关键词显示网上的定义。该词的定义不一定来自于词典,而更多的是源于网上的定义,如:维基百科等。例如,搜索网上关于RSS的定义,其结果如下:语法结构关于Google的语法还有一些,但是常用的基本上就是上述的几个,它们中有些必须单独使用,有些可以混合使用。这些语法结构,不一定非要记住,而可以使用Google的高级搜索,那里基本上就包含了所有的常用语法结构。下面就来认识一下关于Google的高级搜索的内容。如图所示,高级搜索的页面是由上述一些表格组成的,上述表格中绝大多数的功能都可以通过运算符和语法结构在普通检索框内完成,但是对于不熟悉运算符和语法结构的人来说,运用高级搜索可以达到事半功倍的效果。现在,就由上至下一次介绍每一个检索框的功能。包含以下全部的字词:等同于使用默认的“And”运算符。包含以下完整字句:等同于使用双引号。包含以下任何一个字词:等同于使用“OR”运算符。不包括以下字词:等同于使用逻辑非“-”运算符。搜索网页语言是:选择搜索语言。文件格式:等同于使用“filetype”来进行特定格式文档的搜索,同时也可以选择“-filetype”来进行排除特定格式文档的搜索。日期:等同于使用“daterange”。字词位置:等同于选择默认任何位置、“intitle”、“intext”、“inURL”以及“inancher”这些语法结构。网域:和上述的字词位置相配合使用,同时可以选择特定网域也可以排除特定网域进行搜索。使用权限:选择特定权限的网页。类似网页:等同于使用“related”。链接:等同于使用“link”。搜索服务Google提供了很多搜索产品,我们可以通过以下链接查看或进行有针对性的搜索。比如博客搜索、视频搜索、地图搜索、学术搜索等。在这里我们主要介绍学术搜索。学术搜索Google学术搜索的每一个搜索结果都代表一组学术研究成果,其中可能包含一篇或多篇相关文章甚至是同一篇文章的多个版本。例如,某项搜索结果可以包含与一项研究成果相关的一组文章,其中有文章的预印版本、学术会议上宣读的版本、期刊上发表的版本以及编入选集的版本等等。将这些文章组合在一起,可以更为准确地衡量研究工作的影响力,并且更好地展现某一领域内的各项研究成果。每一搜索结果都提供了文章标题、作者以及出版信息等编目信息。一组编目数据,都与整组文章相关联,而google会尽最大努力推举最具代表性的一篇。这些编目数据来自于该组文章中的信息以及其他学术著作对这些文章的引用情况。链接说明1.标题–链接到文章摘要或整篇文章(如果文章可在网上找到)2.引用者–提供引用该组文章的其他论文。3.相关文章–查找与本组文章类似的其他论文。
本文标题:主流搜索引擎使用方法资料
链接地址:https://www.777doc.com/doc-3973670 .html