您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 商业计划书 > 第二章2.2因特网信息的查找――搜索引擎
复习信息获取的一般过程定位信息需求选择信息来源确定信息获取方法,获取信息评价信息如何通过因特网获取信息信息获取一般过程WhenWherewhat文献型口头型电子型实物型直接法间接法权威性准确性客观性时效性信息获取典型案例因特网信息的查找常用的因特网信息检索方法分类使用方法直接访问网页使用搜索引擎查询在线数据库知道信息所在网页的地址或网络实名,可快捷地检索到结果利用分类目录或关键词,在特定的搜索引擎中查找所需的信息利用网上的在线数据库进行查询(在线翻译)搜索引擎(SearchEngine)搜索引擎是指专门用于因特网信息查找的网络工具资料:搜索引擎是何时产生的呢?就是在Internet上执行信息搜索的专门站点,它们可以对主页进行分类与搜索。如果输入一个特定的搜索词,搜索引擎就会自动进入索引清单,将所有与搜索词相匹配的内容找出,并显示一个指向存放这些信息的连接清单。一、搜索引擎发展史1990年以前,没有任何人能搜索互联网。万维网还没有出现,人们通过FTP来共享交流资源,但是由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便。应运而生1990年,加拿大一所大学的师生想到了开发一个可以以文件名查找文件的系统,于是便有了Archie。这个系统被认为是现代意义上的搜索引擎的祖先。由于Archie深受用户欢迎,美国一所大学于1993年开发了相似的搜索工具Gopher,不过此时的搜索工具除了索引文件外,已能检索网页。当时电脑“机器人”是指某个不间断地执行某项任务的软件程序。由于专门用于检索信息的“机器人”程序象蜘蛛一样在网络间爬来爬去,因此,搜索引擎的“机器人”程序就被称为“蜘蛛”程序。随着互联网的迅速发展,一些编程者将传统的“蜘蛛”程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,就有可能检索整个互联网。崭露头角现代意义上的搜索引擎——大家现在熟知的Lycos出现于1994年7月。飞速发展趣味小资料:不经意中诞生的雅虎同年4月,斯坦福大学的两名博士生,DavidFilo和杨致远共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心。从此搜索引擎进入了高速发展时期。目前,互联网上有名有姓的搜索引擎已达数百家,其检索的信息量也与从前不可同日而语。比如最近风头正劲的Google,其数据库中存放的网页已达30亿之巨!二、搜索引擎的工作原理搜索引擎是对互联网上的信息资源进行搜集整理以供用户查询的系统,它包括信息搜集、信息整理建立索引数据库和用户查询三部分。网络用户系统检索代理软件数据库database巡视程序(或人工采集)搜索引擎的工作原理•元搜索引擎:辅助工具三、搜索引擎的类型•全文搜索引擎:关键词检索•目录索引类搜索引擎:分类目录检索搜索引擎按其工作方式主要可以分为:小结:两类搜索引擎的比较类型搜索方法适用范围全文搜索引擎目录类搜索引擎本课练习搜索引擎将不断收集到的网页及网址以数据库的形式组织存贮。查询时用户输入关键词,搜索引擎便会从数据库中检索与之匹配的相关记录,按一定的排列顺序返回给用户。搜索引擎收集,整理信息,以分类目录的形式链接起来,供用户检索,用户通过逐级层层点击浏览这些目录,寻找自己所需的站点信息。可提练关键词的明确信息。基本原则是:构建关键词时,我们尽量不要用自然语言某一类的主题信息1、通过网络了解著名搜索引擎“yahoo”的诞生过程。2、味精是调味料的一种,请问它的鲜味来自哪一种物质,它最早发现于什么汤中?3、我们生活的城市扬州是个历史悠久的城市,在中国历史上,扬州曾有过三次鼎盛时期,请列出三个时期。4、位居世界第二的高峰是什么?位居世界第二的洼地又是什么?它们之间的高低落差多少米?课堂实践:因特网信息的查找请将搜索的结果以word文件的形式上传至FTP服务器上。1、全文搜索引擎(关键词索引)使用自动索引软件来发现并标引网页,建立数据库。它的Spider自动在因特网上漫游,不断搜集各类新网址及网页,形成数以千万乃至亿万条记录的数据库;它以Web形式提供给用户一个检索界面,供用户输入检索关键词(词组或短语等检索项),以其特定的检索算法找出相关记录,按相关度排序输出。关键词就是您输入搜索框中的文字例1、1982年世界杯足球赛冠军得主是谁?例2:地震又称地动、地振动,是地壳快速释放能量过程中造成振动,期间会产生地震波的一种自然现象。多少级以上的地震会造成破坏?a)4.5级b)5级c)6级关键词:震级造成破坏例3:请问位居世界第二的高峰是什么?位居世界第二的洼地又是什么?你知道它们之间的高低落差是多少米?全文搜索引擎的优缺点优点:收集、加工信息的范围广、速度快,能及时地提供新增信息给用户。每个搜索引擎都提供了多种检索功能,有利于提高检索效率。适合于检索特定的信息及较为专业、具体或类属不明确的课题。缺点:一次检索输出的结果可能很多,但当中包含了许多重复、虚假的信息,因此要过滤一大堆与检索主题互不相干的检索结果。(建议在结果中进行二次检索)2、目录索引类搜索引擎一般采用人工方式采集和存储网络信息,是由专业人员在广泛搜集网络资源,进行加工整理,按照某种主题分类体系编制的一种可供检索的等级结构式目录。在每个目录大类及其子类下提供相应的网络资源站点地址,并附有简单的介绍。用户能在目录体系的引导下,通过浏览目录,逐级查找,检索自己感兴趣的主题。目录索引类搜索引擎例:查找上海的相关旅游信息目录索引类搜索引擎的优缺点优点:查准率较高(查全率较低)。适合查找综合性、概括性的主题概念,或对检索准确度要求较高的课题。缺点:专题指南的局限性在于其信息更新速度慢,跟不上网络信息的发展。数据库的规模相对较小,收录的网页数量和深度都相对不足,比较容易遗漏交叉相关信息。3、元搜索引擎元搜索引擎没有独立的索引数据库,在接受查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。在这里,“元”(Meta)为“总的”、“超越”之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。马虎网:下课了……
本文标题:第二章2.2因特网信息的查找――搜索引擎
链接地址:https://www.777doc.com/doc-5863010 .html