您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 数据通信与网络 > 第五讲 网络搜索引擎的使用介绍
网络搜索引擎的使用介绍天津商学院图书馆王宏波讲座主要内容了解什么是搜索引擎掌握搜索引擎的分类方法了解各类搜索引擎的优先和缺点掌握各类搜索引擎的使用方法一、什么是搜索引擎?搜索引擎是一个对互联网上的信息资源进行搜集整理,然后供用户查询的系统,它包括信息采集、信息整理和用户查询三部分。二、搜索引擎的历史早期的搜索引擎是从手工分类网址站发展起来的,适用于信息量不大的情况现代搜索引擎技术用到了信息检索、数据库、数据挖掘、系统技术、多媒体、人工智能、计算机网络、分布式处理、数字图书馆、自然语言处理等许多领域的理论和技术三、搜索引擎的分类按信息采集方法分:目录型-----Yahoo雅虎,搜狐、新浪、网易搜索程序型元搜索引擎按用户搜索方法分:目录型关键词型------Google、Altavista、百度混合型按搜索结果类型分:综合型专业型特殊型各类搜索引擎的定义----目录搜索引擎即是信息采集方式,也是信息搜索方法信息采集:把搜集到的信息资源按照一定的主题分门别类,建立多级目录结构信息搜索:逐层浏览打开目录,逐步细化,就可以查到所需信息特点:需以人工方式或半自动方式采集信息优点:信息准确、导航质量高缺点:需要人工介入,维护量大,信息量少,信息更新不够及时。站点本身的动态变化不会反映到搜索结果中各类搜索引擎的定义----蜘蛛程序搜索引擎蜘蛛(Spider)程序自动访问网站,提取网页信息,并转移到相关链接页面优点:信息量大、更新及时、不需要人工干预缺点:返回信息过多各类搜索引擎的定义----元搜索引擎本身没有存放网页信息的数据库将用户查询提交其他搜索引擎处理对返回结果删重排序后返回给用户优点:返回结果的信息量更大、更全缺点:用户需要做更多的筛选举例:万韦、3721、最酷网站各类搜索引擎的定义----关键词搜索引擎用户输入关键词查找所需的信息资源方便、直接,可以使用逻辑关系组合关键词,对满足选定条件的资源准确定位各类搜索引擎的定义----混合型搜索引擎兼有关键词型和目录型两种搜索方式,既可直接输入关键词查找特定信息,又可浏览目录了解某领域范围的资源各类搜索引擎的定义----综合型搜索引擎不限制搜索主题范围和数据类型各类搜索引擎的定义----专业型搜索引擎只搜集某一行业或专业范围内的信息资源各类搜索引擎的定义----特殊型搜索引擎搜集特定类型格式的信息例如电话、人名、地址、图像、股市信息等四、搜索引擎的使用目录搜索引擎的使用掌握目录分类原则,准确确定目标分类关键词搜索引擎的使用确定使用的搜索引擎和搜索关键词查询条件具体化使用多条件搜索使用减号将不相关的关键词排除使用引号来限定关键词的精确组合(一)知名搜索引擎举要Google()百度()雅虎:雅虎中国:一搜()新浪搜索()搜狐搜索()网易搜索()图行天下()(二)Google的使用技巧Google简介:Google()是一个搜索引擎,由两个斯坦福大学博士生LarryPage与SergeyBrin于1998年9月发明,GoogleInc.于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,Google已经获得30多项业界大奖。到Google的新闻中心(),你可以找到关于一切关于Google的历史和新闻资料。Google的成功得益于其强大的功能和独到的特点:Google检索网页数量达24亿,搜索引擎中排名第一;Google支持多达132种语言,包括简体中文和繁体中文;Google网站只提供搜索引擎功能,没有花里胡哨的累赘;Google速度极快,年初时据说有15000多台服务器,200多条T3级宽带;Google的专利网页级别技术PageRank能够提供准确率极高的搜索结果;Google智能化的“手气不错”功能,提供可能最符合要求的网站;Google的“网页快照”功能,能从Google服务器里直接取出缓存的网页。Google具有独到的图片搜索功能;Google具有强大的新闻组搜索功能;Google具有二进制文件搜索功能(PDF,DOC,SWF等);Google还有很多尚在开发阶段的令人吃惊的设想和功能。1.搜索结果要求包含两个及两个以上关键字示例:搜索所有包含关键词“搜索引擎”的中文网页搜索:“搜索引擎”结果:搜索搜索引擎获得约294,000,000条结果(启用了安全搜索功能),以下是第1-10条。(用时0.11秒)搜索:“搜索引擎历史“结果:搜索搜索引擎历史获得约2,680,000条结果(启用了安全搜索功能),以下是第1-10条。(用时0.07秒)2.搜索结果要求不包含某些特定信息Google用“-”表示逻辑“非”操作。“A-B”表示搜索包含A但没有B的网页。示例:搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页搜索:“搜索引擎历史-文化-中国历史-世界历史”结果:搜索搜索引擎历史-文化-中国历史-世界历史获得约1,720,000条结果(启用了安全搜索功能),以下是第1-10条。(用时0.09秒)。3.搜索结果至少包含多个关键字中的任意一个Google用大写的“OR”表示逻辑“或”操作。搜索“AORB”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。示例:搜索如下网页,要求含有“计算机”和“电脑”,搜索:“计算机OR电脑”搜索计算机OR电脑获得约236,000,000条结果(启用了安全搜索功能),以下是第1-10条。(用时0.09秒)注意:“与”操作必须用大写的“OR”,而不是小写的“or”。4.其他技巧:⑴通配符问题很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google对通配符支持有限。它目前只可以用“*”来替代单个字符,而且包含“*”必须用“”引起来。比如,“”以*治国“”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。例:以德治国、以法治国、以党治国⑵关键字的字母大小写Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。搜索整个短语或者句子Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。示例:搜索关于第一次世界大战的英文信息。搜索:“”worldwarI“”结果:搜索“worldwarI”获得约15,700,000条结果(启用了安全搜索功能),以下是第1-10条。(用时0.26秒)搜索:worldwarI结果:搜索worldwarI获得约461,000,000条结果(启用了安全搜索功能),以下是第1-10条。(用时0.13秒)⑶搜索引擎忽略的字符以及强制搜索Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“”等,以及一些符号如“*”、“.”等,作忽略处理。如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。搜索:“+的历史internet”结果:搜索+的历史internet获得约948,000条结果(启用了安全搜索功能),以下是第1-10条。(用时0.14秒)另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例搜索:“”结果:搜索“”获得约18,300条结果(启用了安全搜索功能),以下是第1-10条。(用时0.52秒)搜索:结果:搜索条结果(启用了安全搜索功能),以下是第1-10条。(用时0.05秒)⑷更好使用google的几个参数介绍对搜索的网站进行限制“site”表示搜索结果局限于某个具体网站或者网站频道,如“”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。示例:搜索中文教育科研网站(edu.cn)上关于搜索引擎技巧的页面。搜索:“搜索引擎技巧site:edu.cn”结果:已搜索有关搜索引擎技巧site:edu.cn的中文(简体)网页。共约有608项查询结果,这是第1-10项。搜索用时0.05秒。注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http://”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。常用域名举例:在某一类文件中查找信息“filetype:”是Google开发的非常强大实用的一个搜索语法。目前,Google已经能检索微软的Office文档如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3文档,Adobe的.pdf文档,ShockWave的.swf文档(Flash动画)等。其中最实用的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前Google检索的PDF文档大约有2500万左右,大约占所有索引的二进制文档数量的80%。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。示例:搜索几个资产负债表的Office文档。搜索:“资产负债表filetype:docORfiletype:xlsORfiletype:ppt”结果:搜索资产负债表filetype:docORfiletype:xlsORfiletype:ppt获得约51,900条结果(启用了安全搜索功能),以下是第1-10条。(用时0.06秒)。搜索的关键字包含在URL链接中“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。示例:查找MIDI曲“稻香”。搜索:“inurl:midi“稻香”结果:搜索inurl:midi“稻香获得约146条结果(启用了安全搜索功能),以下是第1-10条。(用时0.13秒)注意:“inurl:”后面不能有空格,Google也不对URL符号如“/”进行搜索。例如,Google会把“cgi-bin/phf”中的“/”当成空格处理。“allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。搜索的关键字包含在网页标题中“intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网
本文标题:第五讲 网络搜索引擎的使用介绍
链接地址:https://www.777doc.com/doc-3758943 .html