您好,欢迎访问三七文档
什么是搜索引擎?——第一组一、引擎(yínqíng)【英】engine汉语释义:发动机的核心部分,因此习惯上常用引擎指发动机它是整个汽车的动力源泉。二、搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索的相关信息展示给用户的系统。英译searchengine三、搜索引擎的组成搜索引擎的组成搜索器索引器检索器用户接口下一页搜索器的功能是在互联网中漫游,发现和搜集信息。它常常是一个计算机程序,不停地运行。它要尽可能多、尽可能快地搜集各种类型的新信息,同时因为互联网上的信息更新很快,所以还要定期更新已经搜集过的旧信息,以避免死链接和无效链接。返回索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。返回检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序。检索器常用的信息检索模型有集合理论模型、代数模型、概率模型和混合模型四种。返回用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。主要的目的是方便用户使用搜索引擎,高效率、多方式地从搜索引擎中得到有效、及时的信息。用户接口的设计和实现使用人机交互的理论和方法,以充分适应人类的思维习惯。用户输入接口可以分为简单接口和复杂接口两种:简单接口只提供用户输入查询串的文本框;复杂接口可以让用户对查询进行限制。四、工作原理抓取网页处理网页提供检索服务抓取网页每个独立的搜索引擎都有自己的网页抓取程序。它会顺着网页中的超链接,连续的抓取网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定的网页出发,就能搜集到大多数的网页。处理网页搜索引擎抓到网页后,还要做大量的工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其它还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度等。提供检索服务用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页。五、搜索引擎分类全文搜索引擎目录索引类搜索引擎按照工作方式的不同元搜索引擎非主流形式全文搜索引擎从互联网上提取各个网站的信息而建立的数据库中,检索与用户查询条件相匹配的相关记录,然后按照一定的排列顺序将结果返回给用户。目录索引类搜索引擎虽然具有搜索功能,但严格意义上算不上是真正的搜索引擎,仅仅是按照目录分类的网站链接列表而已,用户完全可以不用进行关键词查询,仅靠分类目录就可以找到所需信息。元搜索引擎元搜索引擎在接受用户查询请求时,同时在其它多个引擎上搜索,并将结果返回给用户,在搜索结果排列方面,有的直接来源引擎的排列搜索结果,有的则按自定规则将结果重新排列组合。非主流形式除了上述三大类以外,还有以下几种非主流形式:集合式搜索引擎门户搜索引擎免费链接列表六、作用1.为网络用户提供便利2.是研究网站用户行为的有效工具七、怎样成为一名搜索高手1.选择适当的查询词2.表述准确3.查询词与主题的关联程度和简练程度4.根据网页特征选择查询词如何迅速、准确的在网上搜寻所需资料找软件下载找问题解决办法找论文找人找产品的信息
本文标题:什么是搜索引擎?
链接地址:https://www.777doc.com/doc-5085385 .html