您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 【云南大学】信息检索期末复习重点
云南大学信息检索重点第一章一、检索策略定义:在处理信息需求提问实质的基础上确定检索途径、检索词语并明确各词语之间的逻辑关系,查找步骤、系统输出顺序等方面的科学安排,与检索效果密切相关。二、检全率与检准率1.检全率及其影响:检全率=(检出的相关信息数/信息库中相关信息总数)x100%2.检准率及其影响:检准率=(检出的相关信息数/检出的信息总数)x100%影响检出文献的检索效果的质量。三、检索模型1.布尔检索模型(1)定义:布尔检索模型采用布尔代数和集合论的方法,用布尔表达式表达用户提问,通过对文献表示与提问式的逻辑运算来检索文献。(2)优点:简单、易理解、易实现、能处理结构化提问(3)缺点:A.布尔检索式的非友善性,即构建一个好的检索式是不容易的。尤其是对复杂的检索课题,不易套用布尔检索模型。B.易造成零输出或过量输出。检索输出完全依赖布尔提问式与系统倒排挡中的文献匹配情况,输出量较难控制。C.无差别的组配元,不能区分各组配元的重要程度。D.匹配标准存在某些不合理的地方。由于匹配标准是有或无,因此,对于文献中表因此的数量没有评判,都一视同仁。E.检索结果不能按照重要性排序输出。2.向量检索模型(1)定义:向量检索是以向量的方式确定检索内容的方法,系统中的每一篇文献和每个提问均用等长的向量表示。(2)优点:A.采用自动标引技术维文献提供标引词B.改变了布尔检索非“1”即“0”的简单判断,标引词和文献的相关程度可在【0,1】闭区间中取值,使标引和检索者都可比较灵活地定义组配元(标引词)与文献的关系深度,改变了布尔检索模型僵化的特点。C.由于以其相似的程度作为检索的标准,可从量的角度判断文献命中与否,从而使检索更趋于合理。D.检索结果可按提问的相关度排序输出便于用户通过相关反馈技术修正提问,控制检索量。E.布尔模型的逻辑关系依然可以使用,保留了直观性和方便性。(3)缺点:A.如检索过程转化为向量的计算方法,不能反映出文献之间的复杂关系B.由于对任何一个提问都需要计算全部文献库中的每一篇文献,因此,计算量大、算法复杂度高。C.由于标引加权和检索加权是分离的,因此,随意性较大,难以保证质量。3.概率检索模型4.扩展布尔逻辑检索模型5.相关反馈模型四、信息检索的步骤1.分析研究课题,明确查找要求2.选择检索工具3.制定检索策略、途径和方法4.根据文献线索,查阅原始文献五.信息检索的方法1.布尔检索与(AND*):A*B,表明一篇文献中A和B同时存在或(OR+):A+B,表明一篇文献中A或B必须存在,也包含同时存在非(NOT-):A-B,表明一篇文献中包含A但不包含B2.截词检索(1)类型A.按截断位置:后截断、前截断、中截断;B.截断的字符数量:有限截断、无限截断。(2)实施A.后截断:将截词符号放在字符串右方,保持词的前方一致。B.前截断:将截词放在字符串左方,保持词的后方一致。C.前后同时截断:*computer*D.中截断:又称通用字符法,将截词放在检索词的中间,主要解决一个词的英、美不同拼法及有些词的单复数问题。3.限制检索4.全文位置检索5.加权检索6.多媒体检索第二章一.基本概念1.书目数据库(1)定义:书目数据库是指存储某个领域的三次文献(如文摘、题录、目录等)书目数据的一类数据库,属于参考性数据库中的一种。(2)类型A.文摘、索引数据库:与书本式文摘、索引相同,提供确定的文献来源信息B.图书馆目录库(3)特点A.历史悠久,是机读数据库发展的先驱;B.文献数据量大,连续性累积性强;文献类型齐全,语种多C.使用上没有限制,开放性好D.记录结构简单固定;E.更新周期长,生产费用低;F.数据及主题词规范性好,索引系统完备。2.全文数据库:其记录不仅包括原始文献的目录,而且收录了原始文献的全文。3.一次文献:一次文献又称为原始文献。它指作者以本人的研究成果为基本素材创作而成的文献。包括阅读性图书、期刊论文、科技报告、会议论文、专利说明书、技术标准、学术论文、实验记录、日记、备忘录、内部报告、技术档案、信件等公开或不公开发表的文献。译文一般也归入一次文献。4.二次文献:指文献工作者对分散的、无组织的一次文献进行加工、提炼和浓缩之后得到的产物,是为了便于管理和利用一次文献而编辑、出版和累积起来的工具性的文献。一般包括:目录、题名、文摘、索引。5.三次文献:是指对有关的一次文献和二次文献进行广泛深入的分析研究之后综合概括而成的产物。如评述、综述、进展报告、百科辞典、名录、指南、手册。6.核心期刊:在某一学科中,少数期刊覆盖了该学科的大部分最有参考价值的文献,而多数期刊仅包含该学科的少量最有参考价值的文献,这少数期刊就是该学科的核心期刊。7.灰色文献:非正式出版物又叫零次文献、灰色文献,是指非正式出版物或非正式渠道交流的文献,未公开于社会,只是为个人或某一团体所用。如手稿、私人笔记,信件等。二.特种文献1.定义特种文献是一种介于图书与期刊之间的似书非书、似刊非刊的文献类型,通常在出版发行方面或获取途径方面比较特殊,因此称为特种文献。它包括了除图书、期刊之外的所有其他类型的文献,如会议文献、学位论文、专利文献、标准文献、政府出版物、科技报告、产品样本和产品目录以及档案等。2.类型(1)会议文献检索系统:OCLC-Papers-First、OCLC-Proceeding(2)学位论文A.定义:是高等学校或研究机构学生为获得某红学位二撰写的科学论文。一般分为学士论文、硕士论文和博士论文。B.检索系统:ProQuestDigitalDiseertations;ProQuest博士论文全文数据库;中国学位论文数据库;中国优秀博硕士学位论文全文数据库;Calis高校学位论文库。(3)专利文献A.检索系统:专利局;中国专利信息检索系统;世界知识产权组织网站专利数据库B.专利分类法a.原则:行业分类原则:根据发明的用途或应用领域分类;功能分类原则:根据发明的“直接功能、效用或产品”分类,即以装置、物质或工艺的本质效用作为分类依据。b.IPC:InternationalClassficationofPatentforInvention《国际专利分类表》原则:功能分类与行业分类相结合,功能分类优先为原则分类:IPC按照五个等级分类,部(Section)、大类(Class)、小类(Subclass)、主组(MainGroup)、分组(Group),其中部是分类表中最高等级的分类层,按照领域不同,分为八个大部,用一位的英文字母标记,分别是A-H,分部不设类号。因此,一个完整的IPC分类号由代表部、大类、小类、大组或小组的符号共同组成。一个完整的IPC分类号:F04D29/30F(部)04(类)D(小类)29(主组)/30(分组)(4)标准文献A.定义:指按规定程序制定,经公认权威机构批准的一整套在特定范围(领域)内必须执行的规格、规则、技术要求等规范性文献。B.检索系统:ISO;中国标准咨询网;万方数据资源系统中的标准库;NSSN(5)科技报告:科技报告是报道研究工作和开发调查工作的额成果或进展情况的一种文献类型。美国四大报告(AD报告、PB报告、NASA报告和DOE报告)是世界上出版量最大、影响最广的科技报告。第三章一.百科全书定义:是荟萃人类一切门类或某一类完整知识,概要加以叙述并有序编排的工具书。二.类书1.定义:是摘录、汇集多种文献中的原文,按类目或按韵部编排而成的工具书。2.举例:《太平御览》《永乐大典》《古今图书集成》三.政书1.定义:是记述历代或某一朝代的典章制度的沿革及政治、经济、军事、文化制度等方面史料的工具书。2.三通:《通典》《通志》《文献通志》3.十通:《通典》《通志》《文献通考》《续通典》《续通志》《续文献通考》《清朝通典》《清朝文献通考》《清朝文献续通考》四.类书和百科全书的区别1.编撰方式的不同类书是原始资料的汇集,百科全书是对已有知识的加工、整理和浓缩。2.编排方式不同类书是根据原始资料分类或音韵进行编排,百科全书则是以条目的字顺进行编排。3.内容有别类书一般侧重于文史资料,而百科全书以反应人类全部知识力为己任,对自然科学方面的知识更为重视。4.后期工作不同类书很少补充或者修订,百科全书有连续修订制度。5.检索体系有无百科全书有完备的索引体系,部分条目有参考书目,指引读者进一步阅读等,类书不具备。五.工具书的类型、各自的特点、编排及功能1.书目(1)定义:书目是揭示与记录一批相关文献,并按一定次序编排而成的检索工具(2)编排书目的正文;有的书目还有文献的提要或注释书目记录可根据不同的需要另多种编排方式;书目正文后一般附有辅助索引。(3)功能是进行出版物等级、统计报告、指导阅读和科学管理图书的工具。也是“辨章学术、考镜源流”,鉴别图书真伪异同的重要工具。2.索引(1)定义:又名“引得Index”,原有面检、备检、韵编之称。索引是将书、刊或其他文献中重要的或有意义的信息摘录下俩,按一定方式顺次编排,并注明出处的检索工具。(2)编排:索引正文的结构是款目的有序编排;款目由标目、说明语和出处构成;款目依字顺、分类等方式编排;独立式索引多附有辅助索引。(3)功能:提供文摘索引;指引篇名、文句、语词与专题论述的出处;增加检索途径;比书目能进一步细致地揭示图书报刊的内容;可分析某一文献的主题内容以及关于某一学科或课题的最新观点和发展趋势。从词句索引可研究作者写作分割,寻找特定语句出处,还可供寻章揽句、采撷辞藻。3.文摘(1)定义:文摘是将文献的主要内容简要确切地加以描述,并注明出处,以一定的方法编排的检索工具。(2)编排每一款目分两部分,一部是对文献的内在特征和外在特征的描述,另一部分是关于文献内容的概括。款目一般按分类编排;有些文摘还附有辅助索引。(3)功能通报最新的科学文献;深入揭示文献内容,吸引读者阅读原文;节约阅读时间;确定原文与检索需要的相关程度,决定取舍;帮助读者克服语言上的障碍。六.常用排检法1.字顺法:形序法部首、笔画字顺法号码法四角号码、中国字庋撷、起笔笔形法音序法汉语拼音、注音字母法、韵部排列法2.分类法学科系统排列法(中图法等)事物性质排列法、四部分类法、自编分类体系3.主题法索引4.时序法年表、历表5.地序法地方志、地图、地名录七.图情专业期刊中国图书馆学报、大学图书馆学报、图书情报知识、图书情报工作、图书馆杂志、图书馆建设、图书与情报、情报学报八.图情常用资源1.文摘数据库LISA:Library&informationscienceAbstracts图书馆与信息科学文摘LISAT:Library,informationscienceandtechnologyabstracts2.全文数据库LibraryLiteratureandinformationsciencefulltextACMdigitallibraryASISTdigitalLibrary’EmeraldE线图情国道特色数据库3.网络资源书社会:图书馆和图书馆员的沙龙ODLIS(图情在线辞典)4.常用图情机构网站IFLAUNESCOLibrariesPortalALAPLA中国图书馆学会第五章一.文摘索引型检索工具/数据库1.SCI:ScienceCitationIndex自然科学方面的《科学引文索引》2.SSCI:SocialScienceCitationIndex社会科学方面的《社会科学引文索引》3.EI:EngineeringIndex工程技术信息的《工程索引》4.BP:BIOSISPreview生物科学方面的《生物学文摘》5.MEDLINE医学信息6.CA:ChemicalAbstracts《化学文摘》6.中文社会科学:《全国报刊索引》、《报刊资料索引》二.电子期刊1.英文电子期刊全文数据库:SpringerLink;2.中文电子期刊:中国期刊全文数据库、中文科技期刊数据库、万方数字化期刊三.电子图书和报纸1.免费:ProjectGutenberg古腾堡计划;e书时空2.收费:超星数字图书馆、书生之家、中国数字图书馆、方正Apabi
本文标题:【云南大学】信息检索期末复习重点
链接地址:https://www.777doc.com/doc-1732279 .html