您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > Internet技术与应用第8章
第8章搜索Internet上的信息8.1新浪网搜索引擎使用简介8.2查找感兴趣的新闻组8.3中文Excite搜索引擎使用简介8.4搜狐搜索引擎使用简介8.5常用搜索引擎的网址习题8.1新浪网搜索引擎使用简介•新浪网搜索引擎(原四通利方RichSurf)是面向全球华人的网上资源查询系统。新浪网搜索目前共分为15大类,一万个细目和十余万个网站,是目前互联网上最大规模的中文搜索引擎之一。它提供了“分类检索”和“关键词查询”两种查找方法。分类检索是从主页按照主题分类查找所需的信息,关键词查询是在新浪网目录、网站和网页中搜索指定的关键词。新浪网搜索的查询次序为先执行目录搜索,再执行网站搜索,最后执行网页全文检索。图8.1为新浪网的主页。图8.18.1.1检索方法1.使用关键词进行查询•在新浪网搜索页面上的关键词查询框中输入一个或多个关键词后,单击“搜索”按钮。例如在查询框中输入“网络技术”这个字符串,则包含该字符串的链接结果全部显示出来,单击某一链接查看详细内容,如图8.2。图8.22.使用“+”等符号进行查询•在输入关键字进行查询时,可以使用多种表示“且”关系的逻辑连词,如使用“空格”、逗号(,)、加号(+)和“&”表示。在搜索框中输入搜索字符串,单击“搜索”按钮,可以执行搜索程序。例如:水果+苹果,查找结果见图8.3。•在输入关键字进行查询时,可以使用多种表示“且”关系的逻辑连词,如使用“空格”、逗号(,)、加号(+)和“&”表示。在搜索框中输入搜索字符串,单击“搜索”按钮,可以执行搜索程序。例如:水果+苹果,查找结果见图8.3。图8.33.仅搜索网站标题•在搜索的关键字前加“t:”,表示仅搜索网站标题。如图8.4,在搜索页面的搜索框中输入“t:网络技术”,单击“搜索”按钮,符合搜索条件的网站标题显示出来。图8.44.仅搜索网站网址•在搜索的关键字前加“u:”,表示仅搜索网站网址(URL)。如图8.5,在网页中的搜索框中输入“u:yahoo.com”,单击“搜索”按钮,则统一资源定位器(URL)中包含“yahoo.com”字符串的网址全部显示出来。图8.55.使用数字查询•新浪网搜索引擎支持对数字的查询。如图8.6,在网页的搜索框中输入“t:169”,单击“搜索”按钮,符合查询条件的信息显示出来。6.分类检索•新浪网分类检索共分为十五大类,如图8.7。用鼠标左键单击某一类别即可进入相应的类别进行检索。图8.6图8.7•在图8.7中,单击“电脑网络”目录项,在该目录下(包括其子目录)的搜索功能,可以帮助用户进行更有效的查询。你可以通过选定“所有网站”或“此目录下的网站”选项将搜索范围限定在本级目录下(默认的选项是“所有网站”),如图8.8。图8.88.1.2检索结果•新浪网搜索先返回目录搜索结果,然后输出网站搜索结果,最后返回网页全文搜索结果。也可以直接点击搜索输出页面中的目录查询、网站查询和全文检索超链接来执行目录、网站和网页搜索程序。8.2雅虎中文搜索引擎使用简介•雅虎中文(Yahoo!)是Yahoo!Inc.为全球中文读者开发的网站,它收录了全球网上数以万计的中文网站,不论你要找的网站是用国标码简体字、大五码繁体字还是图形中文,只要是好的中文网站,你都可以在这里找到。图8.9为雅虎中文网站主页。图8.98.2.1检索方法1.关键字检索•在中文雅虎主页的检索栏内键入关键字串(Keyword),单击“Search”按钮,Yahoo!中文搜索引擎会搜索Yahoo!中文分类类目、资料库中的网站信息以及新闻资料库。2.使用双引号进行词组检索•利用双引号查询完全符合关键字串的网站。例如:键入“流行歌曲”找出包含“流行歌曲”的网站,而不会找出包含“流行歌曲集”的网站。3.仅搜索网站标题•在关键字前加“t:”,搜索引擎仅查询网站名称。4.仅搜索网站网址•在关键字前加“u:”,搜索引擎仅会查询网址(URL)。5.使用“+”和“-”进行限制性检索•在关键字前使用“+”来限定关键字串一定要出现在结果中。•在关键字前使用“-”来限定关键字串一定不出现在结果中。6.使用分类检索•使用分类检索时,在检索结果页上先列出符合条件的Yahoo!中文类目,接着是符合条件的相关网站。可以选择浏览Yahoo!中文类目内的网站或直接单击相关网站链接来浏览符合条件的相关网站,或直接单击相关新闻链接浏览符合条件的相关新闻。7.检索新闻页•在检索结果页上会先列出符合条件的相关新闻,你也可以直接点选相关类目连结来检索符合相同条件的类目或网站。8.2.2检索结果•Yahoo!中文搜寻引擎会根据分类类目及网站信息与关键字串的相关程度来排列出相关的Yahoo!中文类目和网站。影响相关程度的因素有:•与关键字串相同的字串越多相关程度越高。•与关键字串完全符合的相关程度高于部分符合的相关程度。•如果网站名称(或新闻标题)与关键字串符合,则其相关程度高于网址(或新闻正文)与关键字串符合的网站。•对于新闻检索,最新更新的新闻将优先列出。8.3中文Excite搜索引擎使用简介•中文Excite搜索引擎的网页地址为,如图8.10所示。在浏览器的地址栏中键入中文Excite的网页地址,选择相应的类别进行信息检索。图8.10•中文Excite搜索引擎是一个同时支持中文和英语(以及其他西方语言)的高性能检索引擎,可以搜索到两百多万个中文网页和五千多万个西文网页,还可以搜索指定的网页数据库,并使用人工智能的方法进行切分词和概念分析。它所包括的网页数据库有:•所有中文网页;•中国网页数据库;•台湾网页数据库;•香港网页数据库;•新加坡网页数据库;•澳门网页数据库;•西方语言网页。•下面各节我们将详细介绍它的使用方法。8.3.1检索方法1.使用关键字进行检索•在中文Excite主页的检索框中输入检索词,例如:pallet,单击“搜索”按钮。2.利用双引号进行词组检索•“词组检索”也称“完全符合检索”,检索结果必须包含与所输入的词组完全一致的字符串。在检索框中输入带引号的检索词组。3.利用“+”和“-”进行限制性检索•在检索词或字前面加上“+”,表示该词或字一定要出现在检索结果中。•在检索词或字前面加上“-”,表示该词或字不能出现在检索结果中。•“+”和“-”与其后面的检索词之间不能留有空格。4.使用布尔检索符号AND,OR,NOT和()进行检索•布尔检索符号包括AND,OR,NOT和()。这些符号必须大写,而且前后要有一个空格。如果使用布尔检索式,Excite检索引擎会自动停止概念分析的检索功能,而检索到与提问词相吻合的网页。•AND:检索到的网页中必须含有所有用AND连接起来的检索词。•OR:检索结果至少含有一个用OR连接起来的检索词。•NOT:检索结果不能含有紧接在NOT后面的检索词。•():如果输入比较复杂的检索式时,可同时使用()和布尔逻辑符号。8.3.2检索结果•Excite中文搜索引擎按相关程度的高低,每次显示10个检索结果,在检索结果左边的百分比就是表示相关程度。百分比越接近100%,表示这个检索结果越符合你的信息需求(相关程度百分比是由引擎通过比较你的检索提问式与网页内容而自动计算出来的)。•Excite中文搜索引擎依次列出相关网页的标题,简[繁]体字标志,网址以及摘要。单击标题或网址就可以链接到此网页。在标题后面,有简[繁]体字标志,[GB]表示此网页是简体字,[BIG5]表示此网页是繁体字。•Excite中文搜索引擎采用人工智能的方法,对网页进行概念分析,并自动做出网页摘要。在每个检索结果的最后一行,你可以看到“检索更多类似该网页的文献”,单击此处,就可以搜索到更多内容与此网页相类似的网页。8.3.3检索说明•Excite中文检索引擎使用人工智能的方法进行切分词和概念分析,搜索与提问式的概念和含义相关的文献,而不只是简单的关键(字)词匹配。请不要在字与字之间插入空格,同时采用一个以上的提问词进行检索,可搜索到更多相关的文献。•如果要求检索结果一定要含有某个关键词或关键字,请在这个关键词前面加上“+”;相反,如果你希望这个关键词不要出现在检索结果中,那么在这个关键词前面加上“-”。8.4搜狐搜索引擎使用简介•搜狐(Sohu)的网页地址为,它是世界上最先进的全文检索产品,能够对各种网络资源(尤其是中文资源)进行搜索,帮助您迅速、快捷地找到所需的信息。图8.11为搜狐中文网站的主页。图8.118.4.1检索方法1.使用关键字进行检索•在检索文本栏中输入要查询的关键字,单击“搜索”按钮,搜狐中文检索系统会返回以下四方面的检索结果:•搜狐分类:符合查询条件的搜狐分类类目。•搜狐网站:符合查询条件的搜狐数据库中收录的网站,结合搜狐分类结构显示。•全球网页:在整个Internet上搜索符合查询条件的网页。•搜狐新闻:符合查询条件的搜狐新闻中的内容。•可以在以上这四个分类中任意切换,得到需要的检索结果。2.使用AND和OR进行检索•AND:检索结果必须包含所有用AND连接起来的检索词。•OR:检索结果至少含有一个用OR连接起来的检索词。8.4.2检索结果影响搜狐中文检索系统检索结果的因素有:*关键字在页面中出现的位置。*关键字在页面中出现的频率。*关键字本身的词性和系统定义的权值。*对新闻搜索的结果来说,日期最新的新闻优先列出。8.5常用搜索引擎的网址以上所介绍的仅仅是几个中文搜索站点,其他一些著名的搜索站点还有:•AltaVista•Webcrawler•Lycos•Opentext•Infoseek•Yahoo!信息检索的主要方法是什么?2.常用的搜索引擎有哪些?3.如何搜索网站标题?4.如何搜索网站网址?5.使用限制性搜索的方法是什么?
本文标题:Internet技术与应用第8章
链接地址:https://www.777doc.com/doc-3819751 .html