您好,欢迎访问三七文档
第四讲搜索引擎及论文写作第一节搜索引擎基本概念1.搜索引擎搜索引擎是Internet上的一种网站,它的主要任务是在Internet上主动搜索Web服务器信息并将其自动索引,其索引内容存储于可供查询的大型数据库中。一个搜索引擎由搜索器、索引器、检索器和用户接口等四个部分组成。•搜索器•其功能是在互联网中漫游,发现和搜集信息;索引器•其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表;检索器•其功能是根据用户的查询在索引库中快速检索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息;用户接口•其作用是接纳用户查询、显示查询结果、提供个性化查询项。2.域名•从字面上讲,域名就是Internet上某个区域的名字。可以简单将域名理解为任何一个想要和Internet连接的公司或机构在Internet上的注册地址。注意:域名、IP地址之间的关系•在新的经济环境下,域名所具有的商业意义已远远大于其技术意义,而成为企业在新的科学技术条件下参与国际市场竞争的重要手段,它不仅代表了企业在网络上的独有的位置,也是企业的产品、服务范围、形象、商誉等的综合体现,是企业无形资产的一部分。常用顶级域名•ac---科研机构•com---Commercialorganizations,工、商、金融等企业•edu---Educationalinstitutions教育机构•gov---Governmentalentities政府部门•mil---Military,军事机构•net---Networkoperationsandservicecenters,互联网络、接入网络的信息中心(NIC)和运行中心(NOC)•org---Otherorganizations,各种非盈利性的组织•info---infomation,提供信息服务的企业•name---name,适用于个人注册的通用顶级域名•coop---cooperation,适用于商业合作社的专用顶级域名•idv---用于个人主题型搜索引擎•主题型搜索引擎将不断收集到的网上页面及地址信息以数据库的形式组织存贮。•查询时用户向其提问框中输入关键词,搜索引擎便会从数据库中检索与之相匹配的相关记录,按一定的排序返回给用户。•优点:是查询全面、充分,用户能够对各网站的每篇文章中的每个词进行搜索,检索直接、方便,而且可使用布尔逻辑检索、短语检索等高级功能。•缺点:繁多而杂乱的感觉。•代表性的主题型搜索引擎是Google、百度(Baidu)网站。图3-1Google的界面分类型搜索引擎通过用户浏览层次类型目录来寻找所需信息。分类一般按主题分类,并辅之以年代、地区等分类。网站多以此方式组织。例如:新浪分类目录计算机与互联网硬件行情报价。优点:使用户清晰方便地查找到某一大类信息,尤其适合那些希望了解某一范围内信息,并不严格限于查询关键字的用户。缺点:搜索范围较全文搜索引擎要小许多,尤其是当用户选择类型不当时,可能遗漏某些重要的信息源。代表性的目录式分类搜索引擎是Yahoo、搜狐、新浪网站图3-2Yahoo的目录界面综合型搜索引擎综合型搜索引擎在采集标引信息资源时不限制资源的主题范围和数据类型,又称为通用型检索工具。如:Google、百度(Baidu)、AltaVista、Excite、Yahoo等也有这种混合功能。图3-4是Yahoo的检索界面,既有检索窗口,也有分类浏览目录。图3-4Yahoo的检索界面特殊型检索工具特殊型检索工具指那些专门用来检索某一类型信息和数据的检索工具,如查询地图的检索工具“MapBlast”、查询图像的检索工具“WebSEEK”等。图3-5是地图搜索引擎的界面。图3-5Go2map.com的界面搜索引擎的关键词语法规则1)自动将关键词拆分进行模糊查询目前自动将关键词拆分进行模糊查询的搜索引擎有Google、百度(Baidu)、中文雅虎、3721、首都在线等。2)按关键词进行精确查询按关键词进行精确查询的有新浪、搜狐、网易、找到啦、中华网和常青藤等。3)检索式的运算符号(1)使用逻辑运算算符(2)使用位置算符(3)使用字段限定使用逻辑运算算符搜索引擎基本上都支持“与”、“或”、“非”、括号或引号等逻辑运算符号,不同的搜索引擎使用的逻辑符不完全相同,常见的有“AND”、“OR”、“NOT”以及“+”、“-”、“&”、“^”等逻辑符号“AND”在中文搜索引擎都可以用空格代替;“NOT”有时可以用减号代替,格式如“关键词A-关键词B”,减号前面要有空格。“OR”有时用“|”表示,例如在百度搜索引擎的格式是“关键词A|关键词B”。Google直接用“OR”表示,格式是“关键词AOR关键词B”。搜索引擎简单使用方法•1、简单查询•在搜索引擎中输入关键词,然后点击“搜索”就行了,系统很快会返回查询结果,这是最简单的查询方法,使用方便,但是查询的结果却不准确,可能包含着许多无用的信息。•2、双引号用()•给要查询的关键词加上双引号(半角,以下要加的其它符号同此),可以实现精确的查询,这种方法要求查询结果要精确匹配,不包括演变形式。例如在搜索引擎的文字框中输入“电传”,它就会返回网页中有“电传”这个关键字的网址,而不会返回诸如“电话传真”之类网页。•3、使用加号(+)•在关键词的前面使用加号,也就等于告诉搜索引擎该单词必须出现在搜索结果中的网页上,例如,在搜索引擎中输入“+电脑+电话+传真”就表示要查找的内容必须要同时包含“电脑、电话、传真”这三个关键词。•4、使用减号(-)•在关键词的前面使用减号,也就意味着在查询结果中不能出现该关键词,例如,在搜索引擎中输入“电视台-中央电视台”,它就表示最后的查询结果中一定不包含“中央电视台”。•5、通配符(*和?)•通配符包括星号(*)和问号(?),前者表示匹配的数量不受限制,后者匹配的字符数要受到限制,主要用在英文搜索引擎中。例如输入“computer*”,就可以找到“computer、computers、computerised、computerized”等单词,而输入“comp?ter”,则只能找到“computer、compater、competer”等单词。•6、使用布尔检索•and,称为逻辑“与”,用and进行连接,表示它所连接的两个词必须同时出现在查询结果中,例如,输入“computerandbook”,它要求查询结果中必须同时包含computer和book。•or,称为逻辑“或”,它表示所连接的两个关键词中任意一个出现在查询结果中就可以,例如,输入“computerorbook”,就要求查询结果中可以只有computer,或只有book,或同时包含computer和book。•not,称为逻辑“非”,它表示所连接的两个关键词中应从第一个关键词概念中排除第二个关键词,例如输入“automobilenotcar”,就要求查询的结果中包含automobile(汽车),但同时不能包含car(小汽车)。•near,它表示两个关键词之间的词距不能超过n个单词。搜索引擎高级检索字段限定•①intitle网页的标题限定••②site限定在某类站点或某个网站内搜索。••③filetype限定文件类型。••④inurl限定地址栏里的域名内的字符串等•⑤精确匹配:双引号和书名号使用字段限定①intitletitle是网页的标题,intitle:A指所有搜索结果的title中都要包含“关键词A”。②sitesite是限定在某类站点或某个网站内搜索。例如“论坛搜索引擎site:sowang.com”,是在sowang这个网站内搜索“论坛搜索引擎”的网页。③filetypefiletype是限定文件类型。用法是“关键词Afiletype:文件格式后缀名”。如“个人年终总结filetype:doc”,搜索结果全都是word文件的个人年终总结。④inurlurl就是地址栏里的域名等。inurl常见的使用方式是“关键词Ainurl:英文字符B”。例如“搜索引擎inurl:ssyq”,是检索在url中含有ssyq的网页中关于“搜索引擎”的信息。第二节资料收集与整理•一、资料的来源•1.专著•2.论文集•3.期刊论文•4.数据库•5.网络资源•6.其他二、如何搜集资料•1.对课题提出一系列的疑问,然后分析这些疑问与课题的关系,以确定想要查询的信息或问题是某一数据、某一概念还是某一观念等。•2.根据这些问题或信息的性质选择检索工具,即确定是通过百科全书等参考性工具书,还是通过报刊索引等检索性工具书进行查找。•3.确定检索途径,即去本校的图书室,还是去本地区的图书室,或者向老师或有关专家咨询。•4.选定检索方法,即从最近出版的书籍和期刊开始往前查,还是限查某几年的书籍和期刊等。•5.利用检索工具书所提供的查找线索进行查找。•6.一旦查到你所需要的文献,就可以去索取该文献。•7.阅读文献,得到你所需要的信息。资料的整理•一、资料的整理归类•1.整理•查阅到有关的文献之后,把它进行摘录(标明出处,包含书名或论文题目、作者姓名、出版单位、版本、出版时间,还有期刊的年号、期号,报纸的年、月、日等)或复印,然后按顺序排列、归类。摘录可以写在笔记本上,也可以写在卡片上。2.加工对文献进行分析思考,然后剔除假材料,去掉过时、重复的材料。对有价值的材料进行研究。这个阶段往往要做以下几方面的工作:写批语,做记号,写提要,做札记,写综述。⑴写批语,就是在所摘录资料的空白处写上自己的见解、解释或质疑。⑵做记号,是读者对重点、难点、精彩之处或自己感兴趣的内容划上的各种标记。⑶写提要,就是对包含各种信息的研究文献进行总结。即把原文的基本内容、主题思想、观点、独到之处或其他数据,用自己的话加以概括。⑷做札记,就是在笔记本上随时记下自己读书时的心得体会和各种想法。札记不求形式,你可以随时随意的记下你在阅读时引发的思考。⑸写综述,就是汇总你所查找的某一类别的所有资料,然后进行加工处理,内化为自己的结构体系写成的一份报告。论文大纲的确定与修改•开题报告怎么写?•大体内容:•题目•关键词(关键词的含义)•大纲目录•简要说明(目前的想法、初步论点或者论证视角)•资料目录正文写作的格式与技巧•一、论文的组成部分•封面•毕业论文任务书•开题报告•文献综述•论文目录(非常重要,二级到三级标题)•中文摘要(300字)•英文摘要•关键词•论文正文(前言、正文主体、结语)•致谢•参考文献及附录(英文翻译)正文写作的格式与技巧•二、正文写作要点•(一)前言•问题及其背景、选题的理由、本文的研究角度、大体写作框架•(二)正文主体•注意标题的拟定、写作风格、处理好资料与论证之间的关系•(三)结语•问题的重要性、本文的主要观点、今后研究的方向•三、致谢
本文标题:检索
链接地址:https://www.777doc.com/doc-4047592 .html