您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 数据通信与网络 > 6GOOGLE等搜索引擎在文献检索方面的应用
Google等搜索引擎在文献检索方面的应用余敏杰mjyu@lib.zju.edu.cn2009.10主要内容•搜索引擎的概念、分类及工作原理•搜索引擎使用原则•常用搜索引擎介绍•网上免费文献检索搜索引擎的概念和分类概念:获得网站网页资料,能够建立数据库并提供查询的系统。分类:全文搜索引擎FullTextSearchEngine分类目录Directory全文搜索引擎全文搜索引擎的数据库是依靠一个叫“网络机器人或叫“网络蜘蛛”的软件,通过网络上的各种链接自动获取大量网页信息内容,并按已定的规则分析整理形成的。Google、百度都是比较典型的全文搜索引擎系统。分类目录通过人工的方式收集整理网站资料形成数据库的,比如雅虎中国以及国内的搜狐、新浪、网易分类目录。另外,在网上的一些导航站点,也可以归属为原始的分类目录,比如“网址之家”。搜索引擎的工作原理全文搜索引擎的“网络机器人”或“网络蜘蛛”是一种网络上的软件,它遍历Web空间,能够扫描一定IP地址范围内的网站,并沿着网络上的链接从一个网页到另一个网页,从一个网站到另一个网站采集网页资料。它为保证采集的资料昀新,还会回访已抓取过的网页。搜索引擎的工作原理分类目录:整个工作过程也同样分为收集信息、分析信息和查询信息三部分,只不过分类目录的收集、分析信息两部分主要依靠人工完成。分类目录一般都有专门的编辑人员,负责收集网站的信息。随着收录站点的增多,现在一般都是由站点管理者递交自己的网站信息给分类目录,然后由分类目录的编辑人员审核递交的网站,以决定是否收录该站点。如果该站点审核通过,分类目录的编辑人员还需要分析该站点的内容,并将该站点放在相应的类别和目录中。搜索引擎使用原则•搜索关键词提练•细化搜索条件•用好逻辑命令“AND”、“OR”、“NOT”及与之对应的“+”、“-”•精确匹配搜索•特殊搜索命令链接(link)、网站(site)、标题(title)•附加搜索功能•用什么样的搜索引擎搜索常用搜索引擎介绍GOOGLE(谷歌)书生之家搜吧科学搜索引擎文摘数据库知识搜索•学术搜索•数字搜索一切用数字说话•新概念搜索追踪学术新概念•学术定义搜索实现学术定义的快速查询•表格图片搜索首创对学术图形、表格内容的搜索•翻译助手全能翻译工具输入检索关键词检索出的翻译结果输入检索关键词近几年被引频次昀高文章某个特定月份浏览昀多的文章表格搜索工具书搜索书生之家搜吧—超级资源门户•聚合了期刊数据库、图书数据库、学位论文数据库、会议论文数据库、外文论文数据库、外文期刊数据库、报纸数据库、财经数据库、法律数据库、标准数据库、教育数据库、视频数据库、百科数据库等各种类型的数据库,可供读者检索使用的资源不仅包括传统的中文图书、期刊、论文,以及畅销网络文学、视频、百科等,而且包括报纸、标准、法律等诸多专业信息资源,更提供了外文的专业学术期刊、论文、图书等资源。搜吧超级资源门户目前聚合了3亿条数据、500万种中外文书目、180万种图书全文、100多万篇国外期刊全文、10万小时视频、10亿页中外文资源,而且还在以每天100万条的速度增长。关键词检索检索结果分类展现自动去重和相似文献关联按关联相似度排序Google是由两个斯坦福大学博士生LarryPage与SergeyBrin于1998年9月发明,GoogleInc.于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。1998年至今,Google已经获得30多项业界大奖。Google简介•特色搜索:pdf湿地遥感2.Site足球site:gov.cn3.定义define湿地4.手气不错西溪湿地•特色搜索湿地6.intitle湿地7.inurlwetland指定文件类型限定网域指定站点类型类似于CNKI的概念检索检索的关键词包含在网页正文中检索的关键词包含在网页标题中检索关键词包含在网址中GoogleScholar•Google学术搜索提供可广泛搜索学术文献的简便方法。可以从一个位置搜索众多学科和资料来源:来自学术著作出版商、专业性社团、预印本、各大学及其他学术组织的经同行评论的文章、论文、图书、摘要和文章。Google学术搜索可帮助您在整个学术领域中确定相关性昀强的研究。Google学术搜索返回的结果记录信息•标题。有链接,网上如有该文的免费全文(一般为PDF文件),则直接链接到可获取全文的网址。否则链接到该文文摘。文摘页面通常会告诉用户获取该文全文的途径和方法。一般为有偿服务;•作者;•出版物(通常为期刊名称或网站);•发表时间;•提供文献信息的单位;•该论文部分摘要;•该论文被其他学术文献引用的次数,并可链接到被引用的详细情况;•相关文章,可点击链接;•HTML版,如该论文有免费全文。则由Google学术搜索自动生成HTML版本;•网页搜索,用Google普通搜索引擎再次搜索该论文。本地馆藏链接全文下载无需进入数据库,直接google网页下载全文Googlebooksearch里面显示的图书都是随机的,每次点击都不一样按题名进行精确检索目标书籍只能在线浏览,不能下载后阅读世界上最大的在线存储服务器商--Rapidshare•Rapidshare.com网站是世界知名的文件上传下载托管服务网站,在ALEXA网站的综合排名为第11位.网站上拥有丰富的资源。•Rapidshare.com网站是世界上速度昀快、容量昀大的网站之,用户上传文件是无限制的。因此这么经典的图书很有可能有全文电子版在此网站。但该网站本身并不提供检索功能。rapidshare搜索引擎1.Rsfind.com可以进行文件、音频、视频、图片、程序等多种类别的搜索,搜索速度很快,结果中显示昀后“检查”的时间,至少可以保证结果前几页的文件是可用的,而且提供多种标签,方便二次检索。缺点是广告太多。rapidshare搜索引擎•2.Filez.com•功能比较少,还好速度不错。号称数据库里的文件多多,可在这几个搜索引擎里,得到的结果是昀少的——不过也昀精确。rapidshare搜索引擎3.Shareminer.com支持Rapidshare、Megaupload、SendSpace、ZShare等,而且支持中文rapidshare搜索引擎4.搜索家族里的老字号,提供了基本的搜索功能,还可以检查已有rapidshare链接的正确性,使用ajax技术后可以有效地提高搜索引擎的工作效率。找到目标书籍,点击进入下载点击freeuser下载免费用户下载需要时间等待点击下载SCIRUS简介•2001年,ElsevierScience和挪威搜索引擎公司合作开发,专门面向科学家和科研人员的学术信息检索工具•Scirus引擎的信息源主要是两部分:经过严格选择的科学资源网页和期刊•目前,利用Scirus可以搜索2.5亿个与科学相关的网页,以及大量的同行评审期刊论文、预印本、报告、科学数据、发明专利等文献信息•Scirus覆盖的学科领域–以自然科学为主,如农业与生物学,天文学,生物科学,化学与化工,计算机科学,地球与行星科学,工程、能源与技术,环境科学,生命科学,材料科学,数学,医学,神经系统科学–也有部分社科资源,如经济、金融与管理科学,语言学,法学,心理学,社会与行为科学,社会学等•网址:://设置使用偏好SCIRUS检索举例可以选择只检索期刊资源、精选网络资源还是其他网络资源检索词组时,请注意勾选此选项保存标记的检索结果,将标记的检索结果发送email,导出标记的检索结果检索结果分类:期刊、精选网页、其他网络资源系统推荐的检索词,可据此修改自己的检索词二次检索框查看期刊论文查看期刊论文馆藏链接按钮查看期刊原文查看期刊论文此篇文章来源于ScienceDirect数据库点击此链接,查看所有通过Scirus查询到的在ScienceDirect数据库中与检索需求相关的记录学术网页超过4亿个机构及科学家主页开放仓储arXiv、NASA预印本系统、课件等学术文献科学、技术、医学及社会科学4000出版商出版的超过16000种期刊包括1000余种开放获取期刊500余种会议录600余种商业出版物超过125种丛书专利信息超过2000万条USPTO(美国专利局)UKIPO(英国专利局)JPO(日本专利局)EPO(欧洲专利局)WIPO(世界知识产权组织)机构仓储接近13万条YaleUniversity\、MIT、StockholmUniversityUniversityofHongKong等Scopus收录的内容—文摘昀早回溯到1823年•部分出版社论文文摘回溯至第一卷第一期,昀早日期为1823年–Elsevier、Springer/Kluwer、Nature–RoyalSocietyofChemistry、AmericanChemicalSociety–InstituteofPhysics、AmericanInstituteofPhysics、和AmericanPhysicalSociety•ArticleinPress–早于官方出版日期1-4个月(依期刊情况而定)–Elsevier、Springer、KargerMedical,ScientificPublisher,Nature,BioMedCentral和IEEENumberofPeer-ReviewedJournalsperSubjectAreaNumberofJournalTitles05,00010,00015,00020,000•5,300•Health•Science•5,842•Physical•Science•3,742•Life•Sciences•2,850•Social•Science•15,000•Total“ThecoverageprovidedbyScopusisbalancedintermsofsubjectareaswhencomparedwithUlrich’score.”–DeMoya(Scientometrics2007)TitlescanbelongtomultipledisciplinesScopus的核心内容:超过15,000种全学科、同行评议期刊Scopus的主页:输入检索词,并在下拉列表中选择检索字段一键下载全文检索结果处理选择处理方式打印、输出、电邮、加入列表文献输出数据库下载不到全文,怎么办?1.向其它学校的同学求助(已经购买了收录该文章的数据库);2.图书馆的文献传递服务;3.网上各文献求助板块或者本校88信息检索版和论文版;4.直接向该作者发E-mail索取;5.搜索免费代理服务器进入一些大型图书馆或数据库。向作者索取原文的一份索取信示例DearMr.(authorname):Iwouldappreciatereceivingareprintofyourarticle:**(titleofthispaper).**journalname.However,thisJournalisnotavailableinOurlibrary.Iwonder
本文标题:6GOOGLE等搜索引擎在文献检索方面的应用
链接地址:https://www.777doc.com/doc-6218272 .html