您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 第8章 信息检索与利用
第8章信息检索与利用1引言美国文献家赫伯特说:“知识的一半,是知道到哪里去寻找它。明日的文盲,不是不能阅读的人,而是缺乏检索能力的人。”本章将在介绍信息检索相关知识的基础上,着重介绍网络学术信息资源数据库的检索与利用,使学生迅速提供获取和利用网上信息的能力。同时,促进学生信息意识、信息价值和信息道德观念的形成与发展。2学习目标通过对本章内容的学习,学生应该能够做到:1.了解:信息和信息资源的内涵,及信息检索基础知识,初步形成使用文献资源的意识与概念。2.掌握:计算机信息检索的方法,能够熟练使用常用的中外文信息资源库,掌握在因特网上查找和利用各种免费学术信息资源的技能。3.应用:能够独立地根据检索课题选用适当的检索工具,并综合使用多种检索工具完成课题的检索。8.1信息检索概述本节主要介绍信息、信息资源的概念与分类、信息检索基本理论、以及信息检索的相关知识内容。348.1.1信息信息(Information)是无处无时不在的,不同学者从自身领域的角度对信息进行了定义:信息论的奠基人美国数学家申农:信息是不确定量的减少。控制论创始人美国数学家维纳:信息是人们在适应外部世界并使这种适应反作用于外部世界的过程中,同外部世界进行交换内容的总称。我国通信和信息科学家钟义信:信息是事物运动的状态与方式,是物质的一般属性。哲学家、心理学家、计算机专家、图书情报学家等都对信息作出了定义。58.1.1信息综上所述,虽然信息应用范围广泛,但是目前还没有统一的定义,大家相对比较认可的观点是:信息是世界上一切事物的状态和特征的反映,是用文字、数据或信号等形式通过一定的处理和传递,来表现各种相互联系的客观事物在运动中所具有的特征的总称。不同事物有不同的存在方式和运动规律,从而构成了各种事物的不同特征,发出不同的信息。总之,信息是对客观世界中各种事物的变化和特征的反映,是客观事物之间相互作用和联系的表征,是客观事物经过感知或认识后的再现。68.1.2信息资源信息资源的概念最早由美国学者于20世纪60年代末提出广义定义信息资源作为信息管理的基本对象和信息社会开发利用的基本资源,是指有序化社会信息集合本身和与此相关的一切管理要素的总和。这些管理要素主要包括信息设备、信息设施、组织机构、信息人员、信息管理资金,以及相应的社会管理体制、社会管理机制和社会管理环境等。在信息社会,信息资源是人类社会物质财富和精神财富的基本来源,是人类进行物质生产和精神生产的主要现实基础,是人类社会在这一历史条件下得以生存和发展的基本前提。狭义定义信息资源作为信息管理的基本对象和信息社会开发利用的基本资源,是指有序化社会信息集合。信息资源是人类存储于载体(包括人的大脑)上的已知或未知的可利用的信息。信息中的载体信息和主体信息是信息资源的最基本的组成部分。按照不同的标准将信息资源划分类如下几类:71.按照开发层次划分零次信息资源在信息流动过程中未经过加工和组织的信息资源。如手稿、书信、笔记、会议记录、演讲,口头言论、聊天记录、BBS内容等。一次信息资源即“原始文献”、“第一手资料”,指作者以本人的生产、科研、社会活动等实践经验为基本素材而创作或撰写的信息资源。如期刊论文、专利文献、科技报告、会议录、学位论文、政府出版物、标准文献等。二次信息资源将分散、无序的一次信息资源,按一定的方法进行整理加工,以使之有序化而形成的信息资源。如目录、索引、文摘等。81.按照开发层次划分三次信息资源根据一定的目的和需求,依据二次信息资源提供的线索,选用大量一次信息资源的内容,经过筛选、分析、综合、提炼和重组等深度加工而形成的信息资源。如综述、述评、进展、动态、教科书、资料汇编、字典、词典、手册、年鉴和百科全书等。零次和一次信息资源是信息检索和利用的主要对象;二次信息资源是信息检索的工具;三次信息资源既是文献信息检索和利用的对象,又可作为检索文献信息的工具。92.按照出版类型划分图书以印刷方式单本发行的出版物。包含专著(学术著作)、教科书、丛书和工具书等。有唯一的标识即国际标准书号ISBN(StandardBookNumber)。连续出版物具有统一题名、印有编号或年月顺序号、定期或不定期在无限期内连续出版、发行的出版物。包括期刊、报纸、年度出版物及其他连续出版的专著丛书和会议录等。有唯一标识即国际标准连续出版物编号ISSN(InternationalStandardSerialNumber)。特种文献具有特定内容、特定用途、特定读者范围、特定出版形式、特定出版发行途径的信息资源。包含会议文献、学位论文、科技报告、专利文献、标准文献、科技档案和政府出版物等。8.1.3信息检索基本理论1.信息检索的含义1950年,莫尔斯(CalvinN.Mooers)首次提出了信息检索(InformationRetrieval)一词。时间通信角度:“信息检索是一种时间性的通信形式”,即通过信息检索使信息发送者和信息接收者(信息检索者)之间建立一种通信。信息处理角度:信息检索是如何处理和管理信息,偏重于信息管理,强调了如何构造以及利用何形式构造信息结构的问题。文献查找角度:信息检索就是查找出用户所需信息文献的过程。从检索过程来看,信息检索分为广义和狭义两重含义。广义:信息检索是将信息按一定的方式进行加工、组织并贮存起来,再根据信息用户的需求找出相关信息的过程。它的全过程又叫信息存储和检索。狭义:信息检索仅指用户根据需求,借助检索工具,从信息集合中找到所需信息的过程,是广义信息检索的后半部分。本书介绍的信息检索指狭义信息检索。10112.信息检索的途径信息检索途径指信息检索的渠道或角度,可分为:内部特征检索途径:从文献所包含的内容特征来检索信息的途径。按照不同的检索语言,分为主题和分类两种途径外部特征检索途径:是从文献的外表特征来检索信息的途径。按照不同的外部特征,分为题名途径、著作途径、序号途径等128.1.4信息检索工具信息检索工具是人们用来报道、存储和查找各类信息的工具。包括传统的二次、三次印刷型检索工具,缩微阅读检索工具,基于计算机的光盘检索系统、联机检索系统,以及基于Internet的网络信息检索系统、网上工具书、搜索引擎、Archie、Wais等各种信息检索工具和检索系统。131.手工检索工具传统的检索工具,主要是各种类型的工具书。工具书是人们根据一定的需要,广泛收集某一范围的有关资料,按特定体例或方式编排,提供基本知识和文献线索的一种特殊类型的图书,是检索文献信息的重要工具。检索类工具书:包括目录、题录、文摘和索引。词语类工具书:包括各类字典、词典(辞典),以及学科名词术语的含义、演变和发展。资料类工具书:包括百科全书、年鉴、手册、名录、类书、政书等。表谱类工具书。包括年表、历表和专门性历史表谱。图录类工具书:包括地图、历史图录、文物图录、人物图录、艺术图录、科技图像等。边缘类工具书:包括资料汇编、史书、方志等。142.机械检索工具机械操作方式来编排、组织或查找文献线索的工具,是手工检索工具向计算机检索系统的过渡阶段包括机电检索工具(如打孔机)和光电检索工具(如缩微机)两种类型只能对某一固定存储形式的信息资源进行特定检索,过分依赖于设备,检索操作复杂,成本很高,并且检索质量和效率也不理想,所以很快被计算机检索系统所取代153.计算机检索系统指借助计算机技术、通信技术、光盘技术、网络技术等信息技术建立的存储和检索信息的检索工具。可分为:光盘检索系统:指利用计算机、光盘驱动器和光盘数据库及其检索软件建立起来的信息检索系统联机检索系统:指用户利用终端设备(包括检索终端、调制解调器和打印机),通过国际(卫星)通信网络,与本地计算机检索系统或远程计算机检索系统的主机联结,从而检索世界各地存储在计算机数据库中的信息资料。如美国Dialog系统,美国、德国和日本的STN系统网络检索系统。网络检索系统是通过因特网提供网络数据库、出版物、书目、动态信息等网上信息资源查询和利用的检索系统。一般由计算机服务器、用户终端、通信网络、网络数据库等组成16小知识:网络数据库也称在线数据库,是指由数据库生产商在因特网上发行,通过计算机网络提供信息检索服务的数据库按照信息处理的层次,网络数据库分为书目数据库:如图书馆公共检索目录(OPAC)文摘数据库:如EI、SCI全文数据库:如中国期刊网、Springer电子期刊全文库178.1.5信息检索语言信息检索语言是用来描述文献内容特征、外表特征和表达信息提问的一种人工语言,即在信息存储时,信息的内容特征(如分类、主题)和外表特征(如题名、著者等)按照一定的语言来描述,检索信息时他的提问也按照一定的语言来加以表达,这种在信息存储和检索过程中共同使用共同遵守的语言就是信息检索语言通常分为分类语言和主题语言两大类181.分类语言分类语言:指将文献主题概念按知识学科性质进行分类和系统排列,并用号码(分类号)来表达其主题概念的语言,它能反映事物的从属派生关系,适合于对信息的族性检索类型:分类语言、组配分类语言和混合分类语言三类,目前的信息检索系统大多数采用的体系分类语言体系分类语言:以学科分类为基础,概括文献的内容特征及某些外表特征,运用概念划分的方法,按知识门类的逻辑次序,从总到分、从一般到具体、从简单到复杂,进行层层划分,从而产生许多不同级别的类目,层层隶属,形成一个严格按学科门类划分和排列的等级制体系,如《中国图书馆分类法》(简称中图法)192.主题语言主题语言是对表达信息主题内容特征的主题词汇概念,经规范化处理所形成的检索语言。可分为:标题词语言标题词是来自于自然语言中比较定型事物的名称,并经规范化处理的能表达文献主题内容的词、词组或短语单元词语言单元词,也称元词,是一种基本的、不能再分的单位词语,可以通过不同单元词的组合来表达信息资源的主题叙词语言叙词是指以概念为基础,经过规范化且具有匹配功能并可以显示词间关系的词或词语吗,是一种既适用于手工检索,又适用于计算机检索的检索语言关键词语言关键词是指选自文献题目、文摘或正文中具有实质意义的语词,它是未经规范化的自然语言208.1.6现代信息检索技术利用计算机信息检索系统进行检索时所采用的技术,其实质是“匹配运算”,即由检索者把检索提问变成计算机能识别的检索表达式输入到计算机中,由计算机自动对数据库中各文档进行扫描、匹配211.布尔逻辑检索逻辑“与”(“AND”或“*”):表示两个概念的交叉或限定关系,只有同时含有两个概念的记录才算命中信息如,要检索即包含“足球”又包含“篮球”的相关信息,检索式:足球AND篮球逻辑“或”(“OR”或“+”):表示两个概念的并列关系,只要含有任何一个概念的记录就算命中信息如,要检索包含“足球”或“篮球”其中一种的相关信息,检索式:足球OR篮球逻辑“非”(“NOT”或“-”):表示两个概念的排斥关系,记录中含有前一个概念而不含后一个概念的就算命中信息如,要检索仅包含“足球”而不包含“篮球”的相关信息,检索式:足球NOT篮球222.位置检索又称邻近检索,可以要求检索词按用户规定的位置出现W算符(with)通常写作A(nW)B,表示词A与词B之间至多可以插入n个其他的词,同时A、B保持前后顺序不变。其中(W)也可以写作(),表示两词之间不得有其他词,但有些系统允许有空格或标点符号N算符(near)通常写作A(nN)B,表示A与B之间至多可以插入n个其他词,同时A、B不必保持前后顺序。其中(N)表示算符两侧的检索词必须前后相连,但词序可颠倒,词间不允许插入其他词或字母,但有些系统允许有空格或标点符号F算符(FIELD)通常写作A(F)B,表示A、B必须同时出现在记录的同一字段,如同时出现在篇名、文摘、关键词等字段中,两词次序、A和B间插入的词数不限233.截词检索也称一致检索或模糊检索,是指用给定的词干做检索词,查找含有该词干的全部检
本文标题:第8章 信息检索与利用
链接地址:https://www.777doc.com/doc-4073805 .html