您好,欢迎访问三七文档
当前位置:首页 > 机械/制造/汽车 > 机械/模具设计 > 郑州大学现代远程教育《信息检索》
郑州大学远程教育彩赋学习中心郑州大学现代远程教育《信息检索》真题[2015版客观题]一、名词:(每题5分,共5×6分)1.检全率与漏检率2.D-KWIC3.文献著录4.词族索引5.检索表达式6.加权检索二、简答:(每空8分,共8×5分)1.什么是索引语言?索引词表的规范化内容包括哪些方面?2.图示CA文摘、索引、附表之间的关系3.简述DIALOG系统的常用指令(至少八个)4.简述建立数据库对知识进行组织的三个层次5.简述联机检索的主要服务范围三、论述:(每题15分数,共15×2分)1.论述主题词的性质2.论述联机检索和网络检索的差异《信息检索》答案一、名词:1.)()()(baaP检出文献总量检出的相关文献量检准率)()()(babN检出文献总量检出的无关文献量误检率2.双重上下文关键词索引(D-KWIC)在编排形式上,结合了KWIC和KWOC的特点,即先抽出文中的一个关键词(第一关键词)提行,作为索引标目,然后将剩余郑州大学远程教育彩赋学习中心部分,按其它关键词(第二关键词)轮排,在轮排条目中,第一关键词用*代替。3.按照一定的条例或标准,将一件文献区别于其它文献的外表特征(包括书名或篇名、著者或译者、出版事项,出处、文种等)、物质特征(包括文献类型、装帧形式、图表、页码等)乃至文献摘要一一加以描述并记载下来的工作称为文献著录。4.词族索引,也称族系索引或词族表,它是把字顺主题词表和附表中的具有属种关系、整体与部分关系和包含关系等主题词,按其学科本质属性展开全显示的一种词族系统。5.检索表达式是计算机检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。6.加权检索,是在检索时,给每个检索词以一个表示其重要度的数值(即所谓“权”),然后对含有这些检索词的文献进行加权计算,其和在规定的数值以上者,作为命中文献输出;权值的大小,表示被检出文献的切题程度。二、简答:1.什么是索引语言?索引词表的规范化内容包括哪些方面?文献存贮时,文献标识按照一定的语言加以描述,而进行检索时,情报提问也按照相应的语言予以表达.这种把标引与检索联系起来,对概念进行规范化处理.使检索得以有效进行的语言就索引语言.其规范化的范围主要有以下三种:第一,同义规范,是指对自然语言中的同义词.准同义词的规范.第二,词义规范,指对自然语言中多义词,同形异义词的规范.这种规范主要是对主题词的概念作进一步说明,以确保在标引和检索时正确运用.词义规范主要有以下三种形式:(1)范围注释.(2)含义注释.(3)观点注释.第三,词类规范,是指对主题词选词范围的一种控制.在自然语言中,词的种类主要有二种:一种是实词,主要包括名词.动词.形容词.代词.数词.和量词等.一种是虚词,主要包括介词.联词.副词.助词等.作为文献检索用的语言词汇,必须具有实际意义,并能反映事物本质属性.因此,主题词的选词范围,一般应控制在实词之中,即名词或动名词.其它词,如形容词.数词.量词等应控制使用,而动词,代词和虚词应完全避免.郑州大学远程教育彩赋学习中心文摘、索引、附表之间的关系3.简述DIALOG系统的常用指令BEGINn(或简写成Bn):开库指令。EXPAND(或简写成E):扩词指令。·SELECT(或S):基本查找指令。SELECTSTEPS(或SSTEPS;SS):分步骤查找指令(分步选词检索指令)。TYPE(或T)或者PRINT(PR):联机或脱机打印指令。SETFILES:选文档指令。REMOVEDUPLICATES(RD):去除重复记录指令。COMBINE(或C):逻辑组配指令。DISPLAYSETS(或DS):回溯检索步骤指令。SAVE:保存检索策略指令。·EXECUTESTEPS(或EXS):执行存储检索策略指令。SORT:排序指令。郑州大学远程教育彩赋学习中心LOGOFFHOLD:暂时关机指令。LOGOFF:关机指令。EXPLAIN:解释指令。4.简述建立数据库对知识进行组织的三个层次。对知识进行第一个层次的组织,是单篇文献。一篇文献往往不止记载一个知识项,并且还记载知识得以取得的环境,条件和方法。有的既然有图表的说明,又有文字的叙述。在一篇文献中,这些都有机地结合在一起,并以逻辑次序加以组织。因此情报用户有时只要获得一篇对口径的文献,就能从中查找,筛选出自己所需要的情报。对知识进行第二个层次的组织,是百科全书,大全,年鉴,手册,表之类的三次文献。这类文献对于知识的组织,所包含的知识项更多,可检性更强。对知识进行第三个层次的组织,是书目,索引,文摘之类的二次文献。它所包含的知识领域更宽,能使成千上万的文献通过题录,简介,摘要置于检索者的控制之下。上述对知识进行三个层次的组织,从而产生了检索系统的全文数据库,事实数据库与数值数据库,书目数据库。5.简述联机检索的主要服务范围追溯检索(RS)这种检索不仅能够查找最新信息资料,而且可以追溯查找数据库存储年限范围内的某一段时间之内的有关文献资料。定题服务(SDI)这是针对相对固定的用户课题提问要求,对新到的数据库文档进行检索并定期向用户提供所需信息资料的服务。联机订购原始文献联机检索到的情报信息,大多数是二次文献。用户如果需要原始文献而在国内馆藏中又查不到时,可以通过联机终端向联机服务系统订购文献原文光盘检索服务光盘检索也是一种联机检索。它不仅可以单独使用,还可以与远程联机检索系统连用。为了便于用户使用和推销产品,把光盘数据库结构、指令语言做成与远程联机检索系统一样郑州大学远程教育彩赋学习中心电子邮件服务大型联机信息系统,都设有电子邮件服务,允许用户发送电子信息到联机检索系统各部门和同一系统中的各个用户。联机系统的电子邮件既可将用户脱机打印的检索结果进行传送,又可以进行邮件快件发送。三、论述:1.论述主题词的性质主题词的概念性,主题词是主题词表中表达一定概念的最小词汇单元,是自然语言中优选出的规范化词汇,这种词汇不仅反映着一定事物的概念,而且作为事物概念的表达形式而存在。主题词的规范性,主要是指对主题词概念的控制,使每一个主题词只能表达一个概念,即主题词的单一性。在文献的实际标引和检索过程中,多数主题都需要用两个或两个以上的主题词进行描述。因此,主题词语言是一种组配性语言。主题词的语义性,是指主题词之间(概念与概念)存在的含义上的相互关系。这种关系主要有同义关系、属分关系和相关关系。主题词语言是一种动态性的语言,随着事物不断发展变化和人们对客观世界认识的深入,不断增删修改,定期更新,以适应现代科学技术发展和文献检索的需要。2.论述联机检索和网络检索的差异更应该引起重视的,是先进的网络技术应用于信息检索领域后,所造成的网络检索和联机检索的不同之处。联机和网络检索的根本差异在于它们使用的技术手段不同。1标引所依据的语言不同联机检索系统采用叙词表等人工语言进行标引,这使它的发展受到人工语言发展的影响,在利用人工语言进行检索的过程中,首先不可避免地会造成标引人员、检索人员和用户对标引词和检索词在理解上的误差,从而影响检索效率。其次,要掌握这种人工语言必须经过专业的培训,这使人工语言多年来一直只为专业信息中介机构采用;网络检索则从一开始就采用自然语言,它无疑更符合人们使用语言的习惯,从而解决了困扰情报界多年的一个郑州大学远程教育彩赋学习中心问题——对语言的理解问题。从某种意义上来说,网络检索的突飞猛进源于自然语言的一些显著优势。2系统界面设计不同联机检索系统和网络检索系统由于面对的用户市场不同,在系统界面设计上也有很大差异。前者自产生起,就面对专业的信息检索机构,因此,一直使用非图形界面,这在一定程度上影响了联机检索的使用。网络检索系统因为面对的是普通用户,系统检索界面设计采用图形界面,非常友好,这对网络检索用户市场的迅速壮大是非常重要的。3信息组织方式不同在传统的联机检索系统中,其数据库主要存储有关主题领域各类文献资料的书目信息。它以文档的形式按线性组织,文档的基本组成单位是记录。记录是作为一个单位来处理的有关数据的集合,它被划分为若干个字段,用于检索和显示。每个字段均有一个供计算机识别的字段标识符。在Internet上,基于Web的信息组织采用了超文本组织方式。超文本系统数据库的特点主要表现在:首先是按照单元、片断、关系将知识存储;其次是用链路网将同一文献或不同文献的相关部分结构化地连接起来,这是传统的联机检索系统所无法实现的;再次是链路网能将语义相近的文献连接起来,用户还可以通过文献间的距离判断文献的重要程度。而且,超文本技术的引入,还使得信息的形式不仅仅局限于字符,而且还可以是声音、图像、动画或其他多媒体的形式。
本文标题:郑州大学现代远程教育《信息检索》
链接地址:https://www.777doc.com/doc-2011437 .html