您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 基础医学 > 信息检索基础知识(精)
第二讲信息检索基础知识图书馆信息服务部:徐淑慧Tel:82519545E-mail:xushuhui@hrbeu.edu.cn本将主要内容信息及相关概念信息的分类信息检索计算机检索系统信息检索语言信息及相关概念信息(Information)的概念信息论的创始人克劳德·香农(ClaudeE.Shannon)从通信系统理论的角度把信息定义为:信息是用来消除不确定性的东西。控制论的创始人、美国科学家维纳(N.Wiener)对信息的含义做了进一步的阐述:信息是人们在适应外部世界并使这种适应反作用于外部世界的过程中,同外部世界进行互相交换的内容的名称。中国学者钟义信对信息的解释:信息是事物运动的状态与方式,是物质的一种属性。普遍认同的一个概念--信息普遍存在于自然界、人类社会和思维领域中,它是客观世界中各种事物变化和特征的反映,是客观事物之间相互作用和联系的表征,是客观事物经过感知或认识后的再现。信息的特性客观性传递性时效性转换性共享性知识(knowledge)的概念知识是人们对客观事物存在和运动规律的认识,是经过人脑加工处理过的系统化了的信息。人们对事物由表及里、由现象到本质、由感性到理性的认识深化,便形成了知识。知识是人类经验和智慧的总结,是人们科学地认识世界、改造世界的力量。知识的存在形式1、存在于人脑记忆中2、存在于实物中3、用文字、图形、符号、代码、声频、视频等技术手段记录在一定载体上的知识。其中第三种形式称作文献文献(literature、document)的概念《中华人民共和国国家标准·文献著录总则》给文献下的定义是:“文献是记录有知识的一切载体”。人类最初是依靠自身来记录和传递知识的,但因受自身条件的限制,无法将信息传递至远方和后世。文献的产生,使信息的记载和传递形成一个飞跃。文献构成三要素文献由三个要素构成,知识、载体、记录方式三位一体不可分割。形态构成文献的重要手段内容本课程所涉及的信息主要为文献信息信息、知识、文献的关系信息知识文献文献信息的分类信息的外延是一个纷繁的体系。按照不同的标准和方法有不同的分类形式文献分类总示意图一次信息二次信息三次信息印刷型缩微型视听型机读型期刊论文会议论文学位论文专利文献标准文献科技报告技术档案政府出版物产品样本文献信息按加工层次分按载体类型分按载体类型分甲骨树皮竹简丝帛等纸介质手写雕刻印刷活字排版激光照排技术印刷型按载体类型分缩微型感光材料为载体缩微胶卷缩微平片电子型磁性或塑性材料为载体磁盘版光盘版联机版网络版视听型磁性或感光材料为载体唱片、录音带、电影片、录像带等信息按载体类型分一、按载体形式划分(1)印刷型:载体:纸张记录手段:手写、打字、印刷和复印等优点:便于直接阅读,使用方便缺点:较笨重、存储密度低,不便于加工、整理和收藏。此类型文献有:期刊、图书等(2)缩微型:载体:感光材料记录手段:缩微照相优点:存储密度较大、体积小、便于收藏保存、便于远距离传递缺点:缺点是不能直接阅读,需借助缩微阅读机才能阅读此类型文献有:缩微胶卷、缩微胶片等(3)视听型(声像型)载体:磁性和感光材料记录手段:借助于特殊的机械装置(如复录机、摄像机、录像机等)直接记录声音、图像优点:直观、生动缺点:制作成本较高,需要借助于一定的设备才能阅读此类型文献有:唱片、录音带、录像带、幻灯片、电影片、多媒体资料等(4)电子型(数字型)载体:光、电、磁介质记录手段:利用计算机进行存储优点:存储密度高,,出版周期短、易更新,传递信息迅速,存取速度快,可以融文本、图像、声音等多媒体信息于一体,信息共享性好、易复制,识别和提取易于实现自动化缺点:需借助计算机等先进技术设备才能阅读此类文献有:电子图书、电子期刊、联机数据库、网络数据库、光盘数据库一次文献(PrimaryDocument):通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。如期刊论文、科技报告、会议论文、专利说明书二次文献(SecondaryDocument):是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。二次文献的重要性在于可以帮助人们查找一次文献。如目录、题录、文摘、索引、各种书目数据库三次文献(TertiaryDocument):是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。如综述、述评、词典、百科全书、年鉴、指南数据库、书目之书目二、按加工层次分:检索的目标检索的手段检索的对象+检索的工具文献结构示意图书目题录索引文摘词典名录指南手册年鉴评述论文丛集百科全书二次文献原始文献(一次文献)三次文献文献整理重组、浓缩信息检索检索过程分析检索者检索系统信息源(大量信息)充分标注(检索语言)可检索(检索技术、规则等)可显示(屏幕显示或打印)信息之间的连接等表达需求反馈结果信息存储与检索过程图文献信息分析检索课题文献信息特征检索提问信息分析著录标引选用检索语言和名称规范文献信息标识(检索项)检索提问标识(检索词)形成形成检索系统输入检索检索结果输出存储过程检索过程信息检索的概念将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。广义的信息检索包括存储和检索两个过程,狭义的信息检索就是指用户查找出所需信息的过程。信息检索原理检索系统将用户的请求与信息集合中的信息进行匹配运算,再将命中信息反馈给用户。信息检索类型按检索对象的性质划分:事实检索、数据检索、文献检索按检索方式划分:手工检索和计算机检索计算机检索又包括联机检索、光盘检索和网络检索。联机检索联机检索是指用户利用计算机终端,通过通信线路或网络,在联机中心的数据库中获取信息。特点同时检索多个数据库、数据质量高、检索机与主机是主仆关系、对检索人员要求高、而且检索需要的费用高。光盘检索用光盘作为信息存储介质的数据库。分为单机检索和局域网内的联机光盘检索。网络信息检索用户在自己的客户端上,通过互联网和浏览器界面对网络信息进行检索。特点数据库分布式存储,数量多,信息量大;由于超文本语传输协议,提供了大量相关链接;内容向多媒体发展,不仅有文本,还有图像、声音等;数据库更新速度快;检索功能强,索引多,易学易懂;但目前各数据库检索界面和检索技巧不尽相同,给使用者造成不必要的麻烦;检索环境宽松,检索费用比联机检索低很多。(网络信息检索也包括通过网络进行的数据库检索)信息检索发展历程手工检索到计算机检索题录文摘信息到全文信息的获得计算机检索经历了联机检索、光盘检索和网络检索方式发展趋势是异构数据库的统一平台检索(我们下面的讲课内容侧重于计算机信息检索)计算机检索系统计算机信息检索系统的概念由存储在一定载体上的有序化信息集合、相应的检索技术与设备等构成的具有存储和检索功能的信息服务体系。2.信息检索系统的构成从物理构成来讲分为硬件、软件和数据资源从检索方式划分联机检索、光盘检索和网络检索硬件检索机服务器网络软件采集存储标引著录规范内容发布检索服务管理数据资源数据库网络信息资源数据库数据库是一系列信息记录的集合,是检索系统中的信息源。存储于计算机的磁带、磁盘或光盘上。数据库分为题录文摘数据库和全文数据库中文数据库和外文数据库综合数据库和专业数据库图书、期刊、学位论文、专利、标准等数据库检索系统的评价检索功能检索技术检索结果用户服务信息检索语言1.检索语言的概念和作用检索语言是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。检索语言是人与计算机对话的基础。检索时的匹配运算就是通过检索语言的匹配来实现的。存储信息时,赋予信息特征标识,如题名、作者、分类号等;检索信息时,用检索语言表达用户的需求。检索举例查找我馆馆藏中“英语”方面的2004年以来出版的图书的藏书情况2.检索语言的分类自然语言从信息内容本身自动抽取的。如题名、关键词、文摘、作者所在机构等。人工语言根据检索的需要由人工规定的,采用规范词或代码来专指某个概念或网罗与之相应的概念。可以将同义词、近义词、相关词、多义词及缩略词规范在一起,由人工控制,包括分类检索语言和主题检索语言。分类检索语言按照学科范畴及知识之间的关系列出类目,并用数字、字母符号对类目进行标识的一种语言体系,也称分类法。目前常用的分类法有《中国图书馆图书分类法》(简称中图法)、《美国国会图书馆分类法》、《杜威分类法》、《国际专利分类表》。《中国图书馆图书分类法》1999年推出了第四版,共分5大部类22个基本大类。22个基本大类是在5在部类的基础上第一次划分得到的,称为一级类目,分别对应一个英文字母;从基本大类起,再连续划分3次,得到二级、三级、四级类目。采用汉语拼音字母和数字相结合的方式对图书进行分类,是目前国内各公共图书馆和高校图书馆普遍使用的图书分类法,我馆藏书也是按照该分类法进行排架。中图法简表中国图书馆分类法样例索书号举例F123.16/W61F123.16-2/Z24/2F123.17/Z89/(2)F123.2/L66-2F12/Y30主题检索语言由主题词汇构成,即将自然语言中的名词术语经过规范化后直接作为信息标识,揭示主题概念之间的关系。主题语言表达的概念比较准确,具有专指性,不同的专业领域或不同的数据库(一般为外文数据库)有自己的主题词表。EI中的词表功能EI记录样例分类语言用于检索信息的特点具有等级结构,便于扩大和缩小检索范围用分类号做检索标识,不存在文种的限制分类表中的类目不能随时变化,不能及时反映新的学科技术,边缘交叉学科只能从学科门类进行检索隶属于一个门类下,造成漏检
本文标题:信息检索基础知识(精)
链接地址:https://www.777doc.com/doc-7289766 .html