您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 综合/其它 > 0905《计算机信息检索》2015年06月期末考试指导
0905《计算机信息检索》2015年06月期末考试指导一、考试说明(一)说明满分为100分,考试时间为90分钟,考试形式为闭卷。(二)题型及各题型所占分数和相应的答题技巧1.单项选择(每题3分,共10题,总计30分)答题技巧:选择最正确的那个选项,可以考虑排除法等选择技巧。2.简答题(每题7分,共14分)答题技巧:需要答出与问题相关的重要知识点(即讲义与课件中的知识点),如需要,可对相关内容展开阐述。3.论述题(每题14分,总计56分)答题技巧:除了结合题目给出重要的知识点外,还要在此基础上对知识点加以扩展阐述。回答要有条理,注意答案的完整性。二、复习重点内容第1章信息资源1.信息资源的基本概念信息资源就其本意来讲,就是信息的资源化或资源化的信息,是经过人类主观处理或加工的,能够传输或传播的,可以对社会生活发挥作用的信息。关于与信息有关的几个概念知识:是指人类对客观事物规律性的认识,是人的大脑通过思维重新组合的系统化的信息集合。文献:是指记录知识的一切载体。情报:是指为一定目的而搜集和传递的有特定效用的知识。2.信息资源的基本特征信息资源的普遍性信息资源的传递性信息资源的时效性信息资源的价值性信息资源的可转换性信息资源的可利用性信息的共享性3.电子信息资源的特征电子信息资源是以数字化形式(即二进制代码0、1),把文字、图像、声音、动画等多种形式的信息存储在非印刷型介质上,以光信号、电信号的形式传输,并通过相应的计算机和其他外部设备再现出来的信息资源。电子信息资源具有如下的特点:存储形式多样化资源数字化交流程度高提高了利用效率内容丰富载体容量大4.电子信息资源的类型(1)按照网络传输协议不同,可将电子信息资源分为:Web信息资源Telnet信息资源FTP信息资源用户服务组信息资源Gopher信息资源(2)按照存取方式的不同,可以将电子信息资源分为:邮件型信息资源电话型信息资源揭示板型信息资源广播型信息资源图书馆型信息资源书目型信息资源交互型信息资源(3)按照信息传播与交流过程,可将电子信息资源分为:稳定的电子信息资源不稳定的电子信息资源(4)按照正式出版物类型的不同,可将电子信息资源分为:电子图书(E-book,Electronicbook)电子期刊(ElectronicJournal)电子报纸(ElectronicNewspaper)中国博客网电子期刊北京青年报的电子报纸第2章信息检索的基本原理1.信息检索的基本原理信息检索就是把检索提问与存储在检索工具中的标引、标识进行比较,两者一致或信息标引的标识包含着检索提问的标识。则具有该标识的信息就从检索工具输出,输出的信息就是检索命中的信息。实际上,信息检索的过程涉及信息的存储和检索两个过程。信息检索可以按照广义和狭义的信息检索来进行定义:广义的信息检索包括信息存储与查询两个部分:信息的存储即对信息的本质特征与形式特征进行记录和描述的过程。信息的查询则首先要将信息提问转换成信息系统可以接受的检索式,然后将检索提问与系统标识进行比较与匹配。狭义的信息检索是以信息系统为基础的单纯的检索过程。狭义的信息检索有许多类型(1)按检索活动的执行主体可划分为手工检索和计算机检索(2)按查询信息的特征可划分为全文检索、多媒体信息检索、事实检索、书目检索、图像检索、数据检索等。2.信息检索语言的概念信息检索语言是一种专门的人工书面语言,它是信息检索系统存储和检索所使用的共同语言。3.信息检索语言的类型检索语言是用于文献信息的存储和检索的。对于非文献信息,若运用检索语言,就要把非文献信息转换为文献信息后再使用。文献检索语言主要反映的是文献信息的内容特征和表象特征。按检索语言的结构原理可以划分为分类语言、主题语言、代码语言。分类语言,如中图分类法中,以大写字母表示一级类目,以数字表示二级和二级以下的类目。二级类目,如工业技术(T)类下进行的细分,双字母。分类语言还包括:体系分类语言,组面分类语言,混合分类语言等。主题语言:一种规范化的自然语言,揭示文献信息的主题特征,用主题词汇表达各种概念,并按字顺排列。包括标题词语言,单元词语言,序词语言以及关键词语言等。代码语言:针对事物的某种特征,用代码加以标引和排列,如学科代码等。按组配方式可划分为先组式检索语言和后组式检索语言。4.信息检索的过程(一)分析研究课题,明确查找要求。(二)选择检索工具(三)确定检索途径及检索方法(四)查阅原始文献信息检索的基本方法(1)追溯法。是利用文献末尾所附的参考文献进行追溯查找的方法。(2)常用法。是利用各种检索工具进行查找文献资源的方法。(3)循环法。是常用法和追溯法的结合,先利用检索工具查找出一批有用的文献,然后利用这些文献所附的参考文献进行追溯查找。第3章计算机信息检索系统1.计算机检索系统的组成(一)计算机检索系统由以下几部分组成:1)信息源信息源是计算机检索系统信息或数据的来源。信息检索系统中的数据主要来自各种公开文献。2)信息组织管理信息组织管理关键要注意信息标引的方法、组织方式、更新周期这几方面。3)系统功能信息检索系统的功能取决于系统所能提供的检索途径、检索方式和检索方法。4)用户接口用户结构主要研究用户模型、信息显示、命令语言、反馈机制这几点5)系统支持技术信息技术支持关系系统及其软、硬件平台的通用性、兼容性、可靠性和稳定性。(二)计算机信息检索系统的基本结构1)硬件部分:以计算机主机为中心的一系列机器设备2)软件部分:信息检索系统中的有关程序和各种文件资料的总称。3)数据库:将数据按一定格式存储在计算机内的数据的仓库,即存储在计算机内的相关数据的集合。2.计算机信息检索系统的工作流程与功能(1)输入环节针对系统建设的目标,搜集和选择特定范围内的信息资源;把收集的信息资源按照所规定的格式进行登载与记录。(2)处理环节处理经过选择的数据和信息。(3)存储环节存储子系统的功能是将加工处理后的信息,按照某种规则和程序聚积在存储载体上,构成可检索的文档。存储的对象由三个方面的内容构成:计算机需要执行的各种程序、数据和文档。(4)传输环节传输子系统的功能主要是通过计算机与通信线路的连接,完成信息编码的传递、转接、接收与处理等工作。(5)输出环节根据用户需求,输出各类有关信息。(6)控制环节控制子系统的功能是根据存取系统内部状态和外部环境的变化,进行管理与调节,来保证系统的有效输入、有效存储、有效输出等环节的协调运行。对信息系统进行控制的方式主要有三种,即:集中控制、分散控制和多层控制。3.五种联机检索的检索策略(1)最专指面优先(mostspecificfacetfirst)(2)最低登录量的面优先(lowestpostingfacetfirst),其中登录量是指索引词在标引中的使用次数。(3)积木型(build-block),形成若干个概念面,分别进行检索。(4)引文珠形增长(citationpearl-growing)指的是依据一两篇最专指面文献逐步扩展,越找越多。(5)逐次分馏(successivefractions),指的是确定一个较大的初始信息集合,再慢慢提高检索的专指度。第4章联机检索系统1.联机检索系统的基本结构联机存取系统由用户检索终端、通信网络、联机存取中心等三个部分组成。1)联机存取中心包括中央计算机(服务器)及其外部设备、数据库检索与管理软件、联机数据库;2)通信网络,联机存取系统的通信网络是指通信子网通过分组交换技术,来完成用户联机检索终端和联机存取中心之间的数据传输。3)用户检索终端及用户接口软件用户检索终端是每个联机信息检索用户必需的设备,用户通过接口软件发送请求和接受结果。2.国外主要联机检索系统(1)DIALOG系统数据库DIALOG系统数据库是目前世界上规模最大的、检索功能最完善、用户总数最多的联机存取系统。它拥有各种数据库600多个,记录量超过3亿条,为全球100多个国家和地区的15万用户提供各种类型的联机存取服务。DIALOG拥有大量的检索符号和完备的索引系统,能够进行广度和深度检索。(2)OCLC系统数据库OCLC(OnlineComputerLibraryCenter),即联机计算机图书中心,OCLC创建于1967年,是世界上最大的文献信息服务机构之一。使用OCLC产品和服务的用户已有70多个国家和地区的38000多个图书馆和教育科研机构。3.光盘检索的原理和特点光盘的工作原理:用激光读写信息光盘检索具有以下特点:检索速度快、检索效果好、检索成本低、安全性能高。4.国内主要光盘数据库检索系统(1)《中国学术期刊(光盘版)》的全文检索管理系统(简称CAJ)有检索网站版、专业版、普通版三种类型。其基本检索功能包括:全文检索,篇名检索,作者检索,机构检索,关键词检索,摘要检索,引文检索,基金检索,分类检索,二次检索和位置检索。高级检索功能包括:组合检索,检索表达式检索,词频检索。输出功能:提供中文、英文、中英文对照3种显示方式,其输出方式如下:输出题录,输出题录摘要,网上浏览全文,下载全文,打印全文,摘录功能。辅助功能:检索词索引,保存检索结果,保存检索表达式,取出检索表达式,设定检索结果顺序。(2)《中文科技期刊》光盘数据库收录了国内出版的中文科技期刊6000多种(包括部分港台期刊),数据每半年更新一次,内容涉及16个专业大类。(3)《中国人民大学报刊复印资料索引》光盘数据库由中国人民大学书报资料中心编选的,因其覆盖面广,信息量大,分类科学,筛选严谨,结构合理完备,成为国内最有权威的具有大型、集中、系统、连续和灵活五大特点的社会科学、人文科学专题文献资料库。1995年开始发行光盘版。5.国外著名光盘数据库系统(1)SPIRS检索系统与GREADLINE数据库1984年美国银盘公司开发了SilverPlatterInformationRetrievalSystem(SPIRS)光盘存取系统。银盘公司出版的光盘数据库范围涉及社会科学、人文科学、医学与生命科学、科学技术、综合参考、商业、健康与卫生、产品与服务指南等领域。(2)ProQuest检索系统与INSPEC光盘数据库ProQuest是由UMI公司开发的信息存取系统。UMI公司生产多种光盘数据库,尽管内容、形式各异,但其检索方法、记录格式等基本相同,所采用的检索系统也都是ProQuest。INSPEC数据库由UMI公司制作。收录了约42000种期刊、2000多个会议录及大量书籍、技术报告及学位论文等书目资料。第5章网络信息资源1.网络信息组织的方式1)文件方式:网络信息系统的最基本方式,可以分为三种形式:顺排文档,倒排文档,索引文档。具有简单、方便的特点,但容易增加网络负载。2)数据库方式:以字段为最小存储单位,可以降低网络传输负载。重复的数据较少,以最优的方式为用户服务,安全性高,操作方便。3)主题树方式:按照一定的主题组织和存放,系统性很强,可扩充性好。但不适应于大型的综合性信息系统,一般用于专业性、示范性数据。4)超媒体方式:超文本与多媒体技术的结合,是网络发展的新趋势。但容易导致用户迷失。5)元数据方式:meta-data,关于数据的数据,即对数据信息所进行的描述。6)网络信息系统新的重要组织方式。可以为各种信息资源提供规范的描述语言,便于用户了解和共享网络信息。2.网络信息资源的特征以网络为传播媒体;数量巨大,增长迅速;信息共享程度高;传播方式具有多样性、交互性;以多媒体为内容特征;使用成本低;动态性强,管理难度较大;3.网络信息检索的特征存取范围覆盖Internet上的几乎所有资源;传统检索方法与全新检索技术相结合;用户界面友好且操作方便;具备良好的导航和编辑功能;网络透明度高;4.网络信息检索的方法信息检索建立在信息的存储和有序化基础之上,包括两方面内容:前期数据准备(信息的标引),后期用户检索。常用的检索方法包括:浏览通过资源指南来查找相应的信息利用网络信息检索工具使用检索软件充分利用E-mail获取信息资源5.搜索引擎的构成及其工作原理搜索引擎的构成包括:搜索器、索引器、检索器、用户接口其工作原
本文标题:0905《计算机信息检索》2015年06月期末考试指导
链接地址:https://www.777doc.com/doc-3053327 .html