您好,欢迎访问三七文档
©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHENAGILECHEN2010年03月07日第二节网海寻珠©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN信息检索的工具--搜索引擎©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN信息检索的工具--搜索引擎•1990年以前,没有任何人能搜索互联网。随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,最早现代意义上的搜索引擎出现于1994年。斯坦福大学的两名博士生,DavidFilo和美籍华人杨致远共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心。从此搜索引擎进入了高速发展时期。目前,互联网上的搜索引擎已达数百家,其检索的信息量也不可同日而语。比如最近风头正劲的Google,其数据库中存放的网页已达30亿之巨!•说:“给我一个支点,我能撬起地球”。套用这句话来形容现在在互联网界如日中天的搜索引擎,那就是“给我一个关键词,我能找遍整个世界”。©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN一、搜索引擎的分类和工作原理•全文搜索引擎–也叫索引型搜索引擎:全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google,国内著名的有百度(Baidu)。•工作原理:由大规模机器运运行的程序--“网络机器人或网络蜘蛛”通过从互联网上提取的各个网站的信息(以网页文字为主)检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。例题1:全文搜索引擎显示的搜索结果是()A、搜索引擎索引数据库中的数据B、被查找的在互联网各网站上的具体内容C、本机资源管理器中的信息D、我们所要查找的全部内容©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN一、搜索引擎的分类和工作原理•目录索引:目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎(见工作原理)。国外代表是:YAHOO,OpenDirectory,国内最具代表性的是搜狐、新浪、网易。•工作原理:它把因特网中的资源服务器的地址收集起来,然后按目录分类,其实只是网站链接列表。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。例题2:在搜狐搜索引擎中,先单击“科学技术”类别名,后选择“科学普及”类别,再单击“中国公众科技网”,这种搜索方式属于()A、全文搜索B、元搜索C、目录搜索D、特色信息检索©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN=more©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN一、搜索引擎的分类和工作原理•元搜索引擎(METASearchEngine):是一种调用其它独立搜索引擎的引擎,把用户的搜索请求提交给多个独立的搜索引擎,然后对返回的搜索结果进行去重、排序等工作,再把处理后的结果显示给用户。在这里,“元”(Meta)为“总的”、“超越”之意。•国外:•国内:©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN一、搜索引擎的分类和工作原理例题3:关于搜索引擎的分类,下列说法正确的是()A、搜狐属于全文引擎,Google属于目录索引类B、搜狐属于目录索引类搜索引擎,Google属于元搜索引擎C、搜狐属于目录索引类搜索引擎,Google属于全文搜索引擎D、搜狐属于元搜索引擎,Google属于全文搜索引擎•例题©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN二、搜索引擎的发展趋势1、多媒体搜索引擎互联网上提供最多的,就是这种以“关键字”为搜索条件,将结果以文本的方式返回给用户。多媒体检索主要包括声音、图像的检索。如:中输入“南京”和在中的区别。©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN二、搜索引擎的发展趋势2、专业垂直搜索引擎网上的信息浩如烟海,一个搜索引擎很难收集全所有主题的网络信息,很难将各主题都做得精确而又专业,使得检索结果垃圾太多。垂直主题的搜索引擎具有很高的针对性,比如象股票、房产、天气、新闻等类的搜索引擎。其重要特征是:专业性©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN垂直搜索引擎站点的几条准则:1、一个好的垂直搜索方向。2、垂直搜索引擎的搜索结果要覆盖整个行业。3、垂直搜索引擎定位于一个行业,服务于一群特定需求的人群。例题4:某同学在的搜索栏输入“北京奥运会”,然后单击“搜索”,请问他的这种信息资源检索是属于()A、全文搜索B、分类搜索C、专业垂直搜索D、目录检索例题5:某同学在“的搜索栏输入高二物理试题“,然后单击”搜索“,请问他的这种信息资源检索是属于()A、专业垂直搜索B、多媒体信息搜索C、全文搜索D、分类搜索©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN三、搜索策略“工欲成其事,必先利其器”,对于搜索引擎的两个最基本的要求是信息的准确性和搜索的快速性。1、逻辑命令:“+”表示包括、“-”表示排除、“*”表示通配符。还有“AND”、”OR”和“NOT”,例如:查成语:天马()(),天()马()。2、特殊搜索命令:专业文档搜索命令(filetype)输入格式:搜索内容+空格+filetype+冒号+命令参数例如:google中输入小说名filetype:txt这个功能要赞一下,搜索出的结果几乎直接都是下载链接,非常方便。我用这个搜索计算机专业的电子书真是太爽了。©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN三、搜索策略示例:把搜索范围限定在特定站点中(site)输入格式:搜索内容+空格+site+冒号+命令参数例如:google中输入曼联site:sports.sina.com.cn表示搜索新浪体育版网站内关于曼联的新闻网际快车site:skycn.com在天空网中下载flashget如果你不想看到那些专业软件下载网站的烦琐广告,这个功能还是很不错的。©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN三、搜索策略示例:把搜索范围限定在网页标题中(intitle)输入格式:intitle+冒号+搜索内容例如:intitle:南师附中江宁分校(试一试区别6950:20300)将搜索的范围限制在网页的标题,网页标题通常是对网页内容提纲挈领式的归纳,搜索结果被缩减到满足我们的实际需要。©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN四、其它多用百度快照百度快照是百度网站最具魅力和实用价值的好东东。如果无法打开某个搜索结果,或者打开速度特别慢,用百度快照办事更有效率。每个被收录的网页,在百度上都存有一个纯文本的备份,称为“百度快照”。所以我在查资料的时候一般直接看百度快照,速度快,且不会看到网站上一些无关的东西。这样让我办事工作的效率会提高不少,但网页的美观会被忽视。©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN本节作业©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN下一章节:©2011NanJingNSFZJNFX.AllRightsReserved.AGILECHEN
本文标题:网海寻珠第二节
链接地址:https://www.777doc.com/doc-3150965 .html