您好,欢迎访问三七文档
电子科技大学图书馆信息咨询部信息检索与利用网络搜索引擎电子科技大学图书馆信息咨询部英特网是人类有史以来最大最丰富的信息知识海洋,它的信息资源主要存放在世界各地的网络服务器中,其信息内容极其广泛,包括艺术、科学技术、环境、建筑、文学、联机图书馆数据库、游戏、经济、教育、娱乐、电影、音乐、杂志、报纸、体育、政治、军事、法律、宗教……网络搜索引擎-是通往这一信息知识海洋的启航港。英特网的信息浩瀚万千,而且毫无秩序,所有的信息象汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁。电子科技大学图书馆信息咨询部搜索引擎指自动从英特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。什么是网络搜索引擎?电子科技大学图书馆信息咨询部搜索引擎的工作原理1、搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(NetworkSpider)的自动搜索机器人程序来连上每一个网页上的超连结。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超连结,机器人便可以遍历绝大部分网页。电子科技大学图书馆信息咨询部搜索引擎的工作原理2、整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。电子科技大学图书馆信息咨询部搜索引擎的工作原理3、接受查询:用户向搜索引擎发出查询请求,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎返回主要是以网页链接的形式提供的。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。电子科技大学图书馆信息咨询部搜索引擎大体工作流程:INTERNET资料数据库索引库有序数据库网络自动搜索工具获取资料读取对应资料记录结果展示用户用户进行检索电子科技大学图书馆信息咨询部搜索引擎分类搜索引擎按其工作方式主要可分为三种:1、全文搜索引擎(FullTextSearchEngine);2、目录索引类搜索引擎(SearchIndex/Directory)3、元搜索引擎(MetaSearchEngine)。电子科技大学图书馆信息咨询部搜索引擎分类1、全文搜索引擎全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Baidu、Fast/AllTheWeb、AltaVista……它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的几家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如soso、搜狗、爱问、Lycos等电子科技大学图书馆信息咨询部搜索引擎分类2、目录索引目录索引具有搜索功能,是按目录分类的网站链接列表。用户也可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有OpenDirectoryProject(DMOZ)、LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。电子科技大学图书馆信息咨询部搜索引擎分类3、元搜索引擎(METASearchEngine)元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、all-in-one、metacrawler、search等,中文元搜索引擎中具代表性的有万纬搜索、Metafisherxooda…电子科技大学图书馆信息咨询部如何获取和利用互联网上的公开和免费信息--利用搜索引擎。电子科技大学图书馆信息咨询部搜索引擎选介:Google百度电子科技大学图书馆信息咨询部主页网址;Google搜索引擎是由两个斯坦福大学博士生LarryPage与SergeyBrin于1998年9月设计,GoogleInc.于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。佩奇布林电子科技大学图书馆信息咨询部Google名称的由来在取名时取的其实是数学名词“古戈尔”(googol,10的100次方,即数字1后跟100个零,常指巨大的数字)的谐音。这显然是一个充满勃勃野心的创业梦想,用创建人佩奇的话说:我们的任务就是要对世界上的信息编组。电子科技大学图书馆信息咨询部特色在于网络结构挖掘技术,分析互联网上的链接结构并进行相关的数据挖掘,能够提供给用户权威结果。Google开发出了世界上最大的搜索引擎,提供了最便捷的网上信息查询方法。(股价超600$/股)通过对近40多亿网页进行整理,可为世界各地的用户提供适合需要的搜索结果,而且搜索时间通常不到半秒现在,Google每天提供2亿次查询服务使用Google图像搜索您可以搜索超过10亿个图像。Google的强大功能电子科技大学图书馆信息咨询部Google的技术特点(1)Google并非只使用关键词或代理搜索技术,它将自身建立在高级的PageRank™(网页级别)技术基础之上,这项技术可确保始终将最重要的搜索结果首先呈现给用户。(2)网页级别可对网页的重要性进行客观的分析。用于计算网页级别的公式包含5亿个变量和20多亿个项。网页级别利用巨大的网络链接结构对网页进行组织整理。实质上,当从网页A链接到网页B时,Google就认为“网页A投了网页B一票”。(3)Google复杂的自动搜索方法可以避免任何人为感情因素。与其他搜索引擎不同,Google的结构设计即确保了它绝对诚实公正,任何人都无法用钱换取较高的排名。Google可以诚实、客观并且方便地帮助用户在网上找到有价值的信息。电子科技大学图书馆信息咨询部Google的特殊与高级功能介绍1.搜索某种类型的文件可查找PDF、Flash等15种非HTML文件大量专业报告都不是以网页格式存在,可以以“filetype”后加文档格式(pdf、doc、xls、wsf、ppt等)限定。eg:通信技术filetype:ppt微软公司filetype:pdf电子科技大学图书馆信息咨询部现在已经可以搜索15种:AdobePortableDocumentFormat(pdf)AdobePostScript(ps)Lotus1-2-3(wk1,wk2,wk3,wk4,wk5,wki,wks,wku)LotusWordPro(lwp)MacWrite(mw)MicrosoftExcel(xls)MicrosoftPowerPoint(ppt)MicrosoftWord(doc)MicrosoftWorks(wks,wps,wdb)MicrosoftWrite(wri)RichTextFormat(rtf)ShockwaveFlash(swf)Text(ans,txt)电子科技大学图书馆信息咨询部2.问答想知道日本有多少人口吗?长江的长度?摩洛哥的首都在哪里?只要输入这些事实性的问题或关键字(如“日本的人口”),Google会在网上查找答案并将其显示在搜索结果的最上面。答案的来源也会一起显示,以方便您了解更多相关的资料。示例:Google的特殊与高级功能长江的长度电子科技大学图书馆信息咨询部3.网页快照Google在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。单击“网页快照”时,您将看到Google将该网页编入索引时的页面。Google依据这些快照来分析网页是否符合您的需求。在显示网页快照时,其顶部有一个标题,用来提醒您这不是实际的网页。符合搜索条件的词语在网页快照上突出显示,便于您快速查找所需的相关资料。尚未编入索引的网站没有“网页快照”,另外,如果网站的所有者要求Google删除其快照,这些网站也没有“网页快照”。电子科技大学图书馆信息咨询部4.货币转换要使用我们的内置货币转换器,只需在Google搜索框中键入您需要完成的货币转换,并单击“回车”键或GoogleSearch按钮即可。下面是一些查寻示例:3.5USD=?GBP10新加坡元等于多少印度卢比8人民币换成泰国的货币30人民币每公升=?美元每加仑示例:3.5USD=?GBP电子科技大学图书馆信息咨询部5.计算器和度量衡转换百度网页搜索内嵌的计算器功能,能快速高效的解决您的计算需求。您只需简单的在搜索框内输入计算式,回车即可。看一下这个复杂计算式的结果:log((sin(5))^2)-3+pi在百度的搜索框中,您也可以做度量衡转换。格式如下:换算数量换算前单位=?换算后单位例如:-5摄氏度=?华氏度电子科技大学图书馆信息咨询部6.相关搜索Google能够提供与您原搜索相关的搜索词。这些相关的搜索词是根据过去Google所有用户的搜索习惯和Google提供的计算两个搜索词之间相关度的独家技术而产生出来的。这些相关的搜索词一般比原搜索词更常用,并且更可能产生相关的结果。只需点击我们提供的相关搜索词,您会自动被带到这个词的结果页。Google相关搜索将帮助您更快地找到更有价值的结果。电子科技大学图书馆信息咨询部7.类似网页单击“类似网页”时,Google侦察兵便开始寻找与这一网页相关的网页。•Google侦察兵可以“一兵多用”。如果您对某一网站的内容很感兴趣,但又嫌资料不够,Google侦察兵会帮您找到其他有类似资料的网站;如果您在寻找产品信息,Google侦察兵会为您提供相关信息,供您比较,使您尽可货比三家;如果您在某一领域做学问,Google侦察兵会成为您的助手,帮您快速找到大量资料。•电子科技大学图书馆信息咨询部8.按链接搜索有一些词后面加上冒号对Google具有特殊的含义。其中的一个词是“link:”。查询link:显示所有指向该网址的网页。例如,“link:”将找出所有指向Google主页的网页。不能将link:搜索与普通关键词搜索结合使用。示例:link:.指定网域有一些词后面加上冒号对Google有特殊的含义。其中的一个词是“site:”。要在某个特定的域或站点中进行搜索,可以在Google搜索框中输入“site:xxxxx.com”。例如,要在Google站点上查找新闻,可以输入:示例:新闻site:电子科技大学图书馆信息咨询部10.在url中搜索在inurl:后加url中的文字,可以限制只搜索url(UniformResourceLocator)中含有这些文字的网页。例如,[inurl:microwave]表示搜索url中含有“microwave的网页;电子科技大学图书馆信息咨询部11.在标题中搜索在一个或几个关键词前加“intitle:”,可以限制只搜索网页标题中含有这些关键词的网页。例如,[intitle:刘德华]表示搜索标题中含有关键词“刘德华的网页;电子科技大学图书馆信息咨询部12.手气不错按下“手气不错™”按钮将自动进入Google查询到的第一个
本文标题:网络搜索引擎
链接地址:https://www.777doc.com/doc-2226076 .html