您好,欢迎访问三七文档
使用不同的搜索引擎在网上获取信息资源•改变关键词•尽量少用通配符与含糊的词•使用逻辑控制符AND,利用多个条件同时满足要求进行限制•使用双引号“””(英文状态下)将连在一起的词变成短语来搜索•用近义词代替关键词•使用逻辑控制符OR•使用其他的搜索网站讨论交流:哪些搜索技巧可以缩小搜索范围?3.2因特网上的信息检索3.2.1因特网信息检索方法•因特网是全球性的分布式系统,信息组织处于一个无序的状态。1.基于超文本/超媒体的信息浏览2.基于目录服务的信息查询3.基于搜索引擎的信息检索1、基于超文本/超媒体的信息浏览能够灵活、方便地查找信息,但信息检索很大程度上取决于所提供的链接,搜索结果带有偶然性和片面性。音频资料视频资料图形图像网页网页网页2、基于目录服务的信息查询人们根据信息的主题将网络上的资源进行分类,并以目录的形式组织和表现。一级二级三级四级3、基于搜索引擎的信息检索查询请求搜索引擎:信息检索工具查询结果:非资源本身资源的链接3.2.2搜索引擎的发展与分类1994年4月斯坦福大学两名博士生美籍华人杨致远和美国人DavidFilo超级目录索引雅虎最早的搜索引擎?1、搜索引擎的产生成功地使搜索引擎的概念深入人心从此搜索引擎进入了高速发展时期1990年起搜索引擎发展举例产生时间搜索工具开发组或公司网站特点1990ArchieMcGillUnibersity可搜索FTP文件名列表1993GopherNevadaSystemComputingServicesUniversity一个分布式信息检索系统1994.4Yahoo斯坦福大学早期Yahoo数据是手工输入1995.12AltaVistaDEC公司第一个支持自然语言关键词和高级检索的引擎1997.10北大天网北大计算机研究室收录网页约6000万,有强大的FTP搜索功能1998.9Google斯坦福大学提供网页评级动态摘要、网页快照,每天更新、多文档格式支持2001.8Baidu百度公司快照、预览、相关词搜索、mp3、flash搜索功能2搜索引擎的分类•目录式搜索引擎•全文搜索引擎•元搜索引擎•垂直搜索引擎•集合式搜索引擎•门户搜索引擎•免费链接列表搜索引擎的分类类型定义举例目录搜索网络信息资源按照主题分类,并以层次树状形式进行组织的一类搜索引擎.优点:实实在在找到用户所关心内容分类,网站导航质量高缺点:分类不够细,需要人工介入,目录的维护量大,更新可能不够及时.搜索引擎的分类类型定义举例全文搜索使用关键词到预先建好的或租用其它索引数据库查询信息的一类搜索引擎.优点:信息量大、更新较及时、不需人工干预。缺点:返回信息过多,有很多无关信息。如果你是搜索引擎公司的老总,谈谈什么是好的搜索引擎?搜索结果准确,搜索精度高响应速度快及时更新检索数据库,剔除“死链”思考搜索引擎技术的发展1、提高对用户检索提问的理解2、对检索结果进行进一步的处理3、确定搜索引擎信息搜索范围,提高搜索引擎的针对性搜索引擎技术的发展1、提高对用户检索提问的理解自然语言的使用使网络交流更加人性化,让查询变得更加方便、直接、有效。案例:了解关于杀计算机病毒的方法。关键词1:计算机病毒关键词2:如何清除计算机病毒搜索引擎技术的发展2、对检索结果进行进一步的处理①基于链接评价的搜索引擎Google设计者认为:一个网页的重要性取决于他被其他网页链接的数量②基于访问大众性的搜索引擎这类搜索引擎的设计者认为大多数人选择访问的网站就是最重要的网站。③去掉检索结果中附加的多余信息搜索引擎技术的发展3、确定搜索引擎信息搜索范围,提高搜索引擎的针对性1、垂直主题搜索引擎:高度的目标化和专业化搜索引擎技术的发展3、确定搜索引擎信息搜索范围,提高搜索引擎的针对性1、垂直主题搜索引擎:高度的目标化和专业化2、非信息搜索:提供FTP类信息的检索搜索引擎技术的发展3、确定搜索引擎信息搜索范围,提高搜索引擎的针对性1、垂直主题搜索引擎:高度的目标化和专业化2、非信息搜索:提供FTP类信息的检索3、多媒体搜索引擎:实现多媒体检索搜索引擎技术的发展1、提高对用户检索提问的理解2、对检索结果进行进一步的处理3、确定搜索引擎信息搜索范围,提高搜索引擎的针对性3.2.3搜索引擎的工作过程信息检索人工智能计算机网络分布式处理数据库数据挖掘数字图书馆自然语言处理……搜索引擎是一个交叉的研究领域,极具综合性和挑战性。目录式搜索引擎的工作过程以人工方式或半自动方式搜集信息,由编辑员查看信息后,人工形成信息摘要,并将信息置于事先确定的分类框架中。用户通过浏览分类目录来查看自己所需要的信息,再链接到信息资源所在的位置。目录页面Sodig分类“国家地区”……“四川”……“成都”……“川师附中”……全文搜索引擎的工作过程搜索器互联网初识数据索引器检索器索引数据库接口界面IE浏览器用户搜索输出查询信息系统定期搜索网络提取并组织、排序关键字对比、提取Spider系统程序:像蜘蛛一样在网络间爬来爬去,追踪互联网,捕获网址。用户接口课堂小结一、信息检索的方法1.基于超文本/超媒体的信息浏览2.基于目录服务的信息查询3.基于搜索引擎的信息检索二、主要二类搜索引擎1、目录式搜索引擎2、全文搜索引擎一、选择题1.以下选项中,不属于因特网中信息检索的主要方法是()A.基于超文本/超媒体的信息浏览B.基于搜索引擎的信息检索C.基于“我的电脑”文件搜索D.基于目录服务的信息查询答案:C2.(多选题)以下选项中,属于网络主要搜索引擎的分类是()A.全文搜索B.目录搜索C.专业搜索D.元搜索答案:AB一、选择题3.我们通过网页中的链接去访问另外一个信息资源的信息检索方法是()。A.基于超文本/超媒体的信息浏览B.基于目录服务的信息查询C.基于搜索引擎的信息检索D.特种搜索引擎答案:A4.使用全文搜索引擎,搜索的结果是()。A.我们所要找的全部信息B.互联网上客观存在的网页数据C.搜索引擎数据库中的数据D.以上都不是答案:C一、选择题5.全文搜索引擎一般采用什么原理来采集信息()。A.人工方式B.“蜘蛛”程序C.关键字检索D.检索工具答案:B6.如果要搜索桂林旅游景点,则应该在搜索框输入什么关键字才能高效地找到有用信息()。A.桂林or旅游景点B.桂林or旅游or景点C.桂林or旅游and景点D.桂林and旅游and景点答案:D二、判断题7.由于因特网是全球性的分布式系统,数以百万计的信息提供都难以按照一定的约定来提供信息,因此,整个因特网的信息组织处于一个无序状态。()答案:对8.搜索引擎是因特网上信息检索的软件系统,最早的搜索引擎出现于1994年4月,是由斯坦福大学的两名博士(其中包含美籍华人杨致远)创办的雅虎。()答案:对9.目录式搜索引擎是以人工方式收集信息,由编辑人员查看信息后并将信息分类置于事先确定的相应目录中。()答案:对二、判断题10.目录式搜索引擎是通过计算机进行分类和整理,不需要人工干预。()答案:错分类不够细,需要人工介入,目录的维护量大,更新可能不够及时.11.全文搜索引擎的优点是信息量大、更新较及时、不需人工干预;缺点是返回信息过多,有很多无关信息,用户必须从结果中进行筛选。()答案:对实践活动1、应用搜索引擎中的图片搜索功能,查找并整理历届奥运会会徽图片,看谁搜索得又快又全,将图片粘贴在学案相应位置。2、尝试在百度或google搜索引擎查询中加入以下的过滤词,看看效果如何,思考可以用这种方法解决些什么问题?•过滤词:Site:网站网址•例:site:sina.com.cn环境保护
本文标题:因特网上的信息检索
链接地址:https://www.777doc.com/doc-1837114 .html