您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 科技文献检索与利用(1)
袁希蓓Tel:021-65983484e-mail:xbyuan@lib.tongji.edu.cn科技文献检索与利用•信息检索概述、检索技术与技巧•图书馆资源利用、搜索引擎、参考工具书与电子图书检索•CNKI中国学术期刊网、维普资讯、万方数据资源系统•世界著名三大检索工具•专利、标准等特种文献检索•核心期刊评价工具及开题调研考核方式开卷考试考题类型:填空题(40分)、简答题(35分)、综合题(25分)考试时间:2个小时信息检索基本概念信息、知识、文献的概念1.信息(information):信息是事物发出的体现它存在和运动状态的信号和消息。是通过信号带来的消息。生活中信息无处不在,无时不有,它们是知识产生的原料,它们经过人脑接收、处理后,成为系统化的信息,知识由此产生。2.知识:知识是信息的一部分,是一种特定的人类信息。知识是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映。3.文献(document):国家标准《文献著录总则》(GB/T3792.1-1983)给出的定义为:文献是记录有知识的一切载体。国际标准化组织ISO在《文献情报术语国际标准》(ISO/DIS5217给出的定义是:“为了把人类知识传播开来和继承下去,人们用文字、图形、符号、音频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录在唱片上,或存储在磁盘上。这种附着在各种载体上的记录统称为文献。三者的关系:知识是对信息加工、吸收、提取、评价的结果,即系统化的信息成为知识,知识记录下来成为文献。信息检索定义广义的信息检索:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。全称为“信息存储与检索”。狭义的信息检索:指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。传统的图书馆是专用于典藏书籍的处所,其收藏的主要是纸本文献。随着科学技术的迅速发展,现代的记录形式和出版方式有了很大变化,“图书”这个概念已经不能概括当前所有的出版物。今天,人们将数据、期刊、资料等出版物统称为“文献”,图书馆文献资源类型的划分标准纷繁复杂,这里主要介绍三种划分方法。1.根据文献的载体形式划分2.根据文献的编辑出版形式划分3.按文献的结构等级(文献的加工程度)划分科技文献类型印刷型缩微型机读型视听型图书连续出版物资料缩微平片缩微胶卷缩微胶片磁带、磁盘光盘联机网络版录音带、录像带唱片、幻灯片电影胶卷1.根据文献的载体形式划分(1)印刷型文献:载体:纸张记录手段:手写、打字、印刷和复印等优点:便于直接阅读,使用方便缺点:较笨重、存储密度低,不便于加工、整理和收藏。此类型文献有:期刊、图书、资料等(2)缩微型:载体:感光材料记录手段:缩微照相优点:存储密度较大、体积小、便于收藏保存、便于远距离传递缺点:缺点是不能直接阅读,需借助缩微阅读机才能阅读此类型文献有:缩微胶卷、缩微胶片等(3)声像型文献(视听资料)载体:磁性和感光材料记录手段:借助于特殊的机械装置(如复录机、摄像机、录像机等)直接记录声音图像优点:直观、生动缺点:制作成本较高,需要借助于一定的设备才能阅读此类型文献有:唱片、录音带、录像带、幻灯片、电影片、多媒体资料等(4)电子型文献(以前叫作机读型)载体:光、电、磁介质记录手段:利用计算机进行存储优点:存储密度高,,出版周期短、易更新,传递信息迅速,存取速度快,可以融文本、图像、声音等多媒体信息于一体,信息共享性好、易复制,识别和提取易于实现自动化缺点:需借助计算机等先进技术设备才能阅读此类文献有:电子图书、电子期刊、联机数据库、网络数据库、光盘数据库图书连续出版物特种文献普通图书工具书期刊型书籍报纸期刊科技报告专利文献学位论文标准规范政府出版物产品资料会议文献1.图书(book)•定义:图书是对某一领域的知识进行系统阐述,或对已有的研究成果、生产经验的等作概括论述。因此图书使人们获得系统性知识的主要来源。图书包括教科书、专著、文集、工具书等。工具书又包括词典、百科全书、手册、年鉴等。•特点:内容全面系统,成熟可靠,带有总结性。但出版周期较长,报道速度慢。图书出版的目的是传授知识,而不是传授最新情报。•格式:著者、书名[M]、版本(第1版不标注)、出版地、出版者、出版年、引文所在的起始或起止页码。正式出版的图书都有国际标准书号(ISBN),他是每一种正式出版的图书的唯一代码标识。2.期刊(journal、periodical)定义:是指名称固定、周期出版、刊载多个作者论文和其他文章的连续出版物。期刊按内容和性质划分,主要有学术性期刊,如各种学报、通报、汇刊、评论、进展;快报性期刊,如各种通讯、快报;检索性期刊,如各种文摘、索引性刊物,目前这类刊物已经电子化,成为文摘索引数据库。特点:出版周期短,报道速度快,数量大,内容丰富,能及时反应世界科技发展水平。因此期刊是了解科技动态,获取最新信息的总要来源。格式:著者、题(篇)名[J]、刊名、出版年、卷号(期号)、引文所在的起始或起止页码。正式出版的期刊有连续出版物号(ISSN)3.科技报告(report、technicalreport)定义:是科学技术工作者围绕某个课题研究所取得的成果的正式报告,或对某个课题研究过程中各阶段进展情况的实际记录。其中绝大多数涉及高、精、尖科学研究和技术设计及其阶段进展情况,客观地反映科研过程中的经验教训。格式:著者、报告题名[R]、出版地、出版者、出版年、页码。4.会议文献(conference、paper)定义:会议文献是在各种学术、专题会议上发表的论文和报告。会议文献多数以会议录的形式出现。是专业领域最新研究成果报道的一种主要方式。格式:文献著者、题(篇)名[A]、论文集名[C]、出版地、出版者、出版年、引文所在起始或起止页码。5.专利文献(patentdocument)定义:发明人或专利权人申请专利时向专利局所呈交的一份详细说明发明的目的、构成及效果的书面技术文件,经专利局审查,公开出版或授权后的文献。广义包括专利申请书、专利说明书、专利公报、专利检索工具以及与专利有关的一切资料。格式:专利所有者、题名[P]、专利国别、专利号、出版日期。6.标准文献(standard、specification、requirement)定义:指经过公认的权威当局批准的以文件形式表达出的统一规定,包括技术标准、技术规格和技术规则等文献的总称。格式:标准代号(标准顺序号-发布年)、标准名称[S]。7.学位论文(dissertation、thesis)定义:高等学校或研究院所的学生在导师指导下从事某一学术课题的研究,为获得某种学位而撰写的学术性较强的研究论文。格式:著者、题(篇)名[D]、保存地点、保存单位、年份、引文所在起始或起止页码。8.政府出版物(governmentdocument)政府出版物是各国政府部门及其所属机构发表、出版的文件,其内容广泛,概括可以分为行政性文献和科技文献两大类。9.产品资料、技术档案等(productliterature、technicalrecord)各厂商为推销产品而印发的商业宣传品,包括产品样本、产品目录、产品说明书、厂商介绍、技术座谈资料等。企业或科研机构在技术工作中形成的、有一定的工程对象的技术文件。如任务书、协议书、技术经济指标和审批文件、研究计划方案大纲和技术措施等。3.按文献的结构等级(文献的加工程度)划分零次文献:也称零次信息。指未经正式发表或不宜公开和大范围内交流的比较原始的素材、底稿、手稿、书信、工作文稿、工程图纸、考察记录、实验记录、调查稿、原始统计数字,以及各种口头交流的知识、经验或意见论点等,此类更为原始性的文献多保留于科技人员之手。另外,科技部门、有关管理部门和计划部门也有收藏。这类文献在较小的范围内交流、使用、参考,其传播渠道少,或常保密,或限制使用以及因珍稀的原因,不为人们知晓而多被埋殁。其形式多是抄件、打字件、油印件、内部铅件、复制印刷、描图以及内部录音、录像等等。其特点是信息来源直接、真实,内容新颖。一次文献:原始文献。是著者在科研、生产实践中所获得的第一手资料撰写成的文献。如期刊论文、会议论文、科技报告、专利说明书、标准文献等,大部分期刊上发表的文章和在科技会议上发表的论文均属一次文献。原创!二次文献:指根据实际需要,按照一定的科学方法,将特定范围内的分散的一次文献进行加工整理使之有序化而形成的文献。它能较为全面地系统地反映某学科某专业文献的线索,是检索一次文献的工具。这类文献有:期刊(仅限于揭示和评述一次文献的那些类型)、索引和文摘、论文集、图书馆目录等。三次文献:指通过二次文献提供的线索,选用有关的一次文献的内容,进行分析、综合、研究后而编成的文献。一般包括专题述评、动态综述、进展报告、学科年度总结以及词典、手册、百科全书、年鉴等工具书。三次信息具有系统性、综合性、知识性和概括性的特点,因此,要在浩瀚的信息中查找所需的特定的一次信息,往往离不开二次和三次文献。计算机检索技术在计算机检索中,为了提高检索效率,常用一些检索技术有:布尔逻辑检索技术、截词检索技术、邻近检索技术、字段限制检索技术。1、布尔逻辑检索:在计算机文献检索中,用户的检索需求是通过检索提问式表达的,逻辑算符在检索提问式中起着逻辑组配作用,它们能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索需求。布尔逻辑(组配)算符:系统中采用的逻辑组配算符是布尔代数中的逻辑运算符AND/*(与)、OR/+(或)、NOT/—(非)。逻辑“与”(AND或*):用于表达两个或两个以上检索词之间的相交关系或限定关系运算。逻辑“与”检索能增强检索的专指性,使检索范围缩小,提高查准率。如:查找“胰岛素治疗糖尿病”的检索式为胰岛素and糖尿病2.逻辑“或”(OR或+)3.逻辑“非”(NOT或-):用于表达两个或两个以上检索词之间的并列关系。运算逻辑“或”检索扩大了检索范围,提高检索信息的查全率。此算符适于连接有同义关系或相关关系的词。如:railwayORrailroad土豆OR马铃薯用于表达两个或两个以上检索词之间中排除不需要的检索词运算,可以缩小检索范围,增强检索的准确性。此运算适于排除那些含有某个指定检索词的记录。但如果使用不当,将会排除有用文献,从而导致漏检。如:fruitNOTapple•对于一个复杂的逻辑检索式,检索系统的处理是从左向右进行的。在一个检索式中,可以同时使用多个逻辑运算符,构成一个复合逻辑检索式。复合逻辑检索式中,运算优先级别从高至低依次是非、与、或。可以使用括弧改变运算顺序。但应注意,对于同一个布尔逻辑提问式来说,不同的运算顺序会有不同的检索结果。布尔逻辑的运算也可以进行合并同类项等,如:A*B+A*C=A*(B+C)2、截词检索(truncation)—截词符就是把检索词截断,取其中的一部分,再加上截词符(也称通配符)一起进行检索。主要用于检索词的单复数、词性的词尾变化、词根相同的一类词,以及同一词的拼法变异等,是提高查全率,防止漏检的有力手段,也可以简化输入。截词检索按截断的位置不同,分为左截断、右截断和中间截断;按截断的字符数量来分,分为有限截断、无限截断。通常用“*”号表示无限截断,“?”号表示有限截断。即“*”号代表两个或两个以上的字母,“?”号代表一个字母。如:wom?n可检索出:woman,women;child*,可查到child,children,childish,childhood等所有以child开头的单词;physic??,可查到physic,physical,physics。3、邻近检索也称位置运算检索,即用邻近运算符连接两个检索词,表示要求两个检索词同时出现在同一记录中,两词的相互位置必须符合规定的相邻度才能被命中检出。•利用布尔逻辑算符对检索词进行逻辑组配时,未限定检索词之间的位置关系,会影响某些课题的查准率并容易造成误检。为了弥补其不足,检索词之间用位置运算符来表达。位置运算符
本文标题:科技文献检索与利用(1)
链接地址:https://www.777doc.com/doc-4648874 .html