您好,欢迎访问三七文档
第一章文献信息源绪论1文献、信息、信息检索(1)文献(Document,Literature)国际标准化组织《文献情报术语国际标准》(ISO/DIS5217)对文献的定义:“文献是在存贮、检索、利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存贮有信息或数据的载体。”我国颁布的《中华人民共和国国家标准·文献著录总则》(GB3792.1-83)定义:“文献是记录有知识的一切载体。”随着科学技术的发展,知识的记录手段与存贮载体不断推陈出新,使文献概念的外延不断扩大。现代文献囊括了各种信息载体,如传统的书刊、文稿,如今的音像制品、机读资料、电子出版物等。由上述可见:文献是由知识、载体和记录三个基本要素所构成。知识是人们在社会实践中积累的经验,是文献的内容;载体是文献的物质实体,如竹简、纸张、胶卷、光盘等;记录是产生文献的手段,如铸刻、书写、印刷、复制、录音、录像等,它是知识、信息与载体的联系方式。文献的主要作用是存贮、传播、交流知识和信息。几千年来,文献作为信息的载体,一直是人类了解过去、认识现在和预测未来的重要依据,是传播信息的主要手段和途径。所以人们早已习惯于从文献中获取信息,将其视为信息的源泉。文献能帮助人们克服时间与空间障碍,记录、贮存和传递人类已有的知识与经验,从而推动人类知识的增加和科技的进步。文献中所记载的知识和信息内容可以供无数人同时使用或先后、异地反复使用,还可以通过复制(复印、转录、缩微、拷贝)等手段保持其原来的内容。合理、有效地开发文献资源,能给人类社会带来巨大的社会效益和经济效益。(2)信息(Information)人们在生活、工作、学习中,无时不在接受、运用、交流、传递着信息。但是关于什么信息?至今尚无确切、公认的定义。从客观上看,信息是指一切事物存在方式和运动规律的表征。它是事物的一种普遍属性,只要事物存在,就会有表征其属性的信息。它广泛存在于自然界和人类社会中,信息无处不在。人们正是通过自然界和人类社会中产生的不同信息来区别和认识各种事物的。从主观上看,信息是指人们对世界的认识所形成的各种知识、学问、消息等,它与人类的智能活动密切相关。这里所说的信息主要是指后者,它是人们认识世界和改造世界,取之不尽、用之不竭的宝贵资源。在人类进入信息社会的时代,信息已成为发展科技、经济、文化、教育的重要支柱之一。信息按表现形式可分为文字信息、图像信息、数值信息、语音信息等类型。各种类型的信息来源于自然界和人类社会中,人们从事各种社会活动如生产、科研、经营、生活等都会产生和运用信息。而对于大多数信息用户而言,文献是其获取信息的主要来源。(3)信息检索(InformationRetrieval)信息检索是指将杂乱无序的信息有序化形成信息集合;并根据需要从信息集合中查找出特定信息的全过程(见下图),全称是信息存储与检索(InformationStorageandRetrieval)。信息的存储主要是指对一定范围内的信息进行筛选、描述其特征,加工使之有序化形成信息集合,即建立数据库,这是检索的基础;信息的检索是指采用一定的方法与策略从数据库中查找出所需信息,这是检索的目的,是存储的反过程。存储与检索是一个相辅相成的过程。为了迅速、准确地检索,就必须了解存储的原理。通常人们的信息检索是指后一过程,即信息查找过程,也就是狭义的信息检索(InformationSearch)。第一章文献信息源1.1文献的特点1.1.1文献数量大,增长速度快随着科学技术和社会生活的飞速发展,人类知识总量在迅速猛增。作为存贮、传播知识的载体文献,随着知识量的增加其数量也在激增,而且增长速度很快。据统计,目前全世界每年出版各种文献总量约12000万册,平均每天出版文献约32万件。下面是美国《化学文摘》报道文献量的变化情况,从中不难看出文献数量的增长之快。第一个百万条1907-1946年历时40年;第五个百万条1972-1975年历时4年;第二个百万条1947-1960年历时14年;第六个百万条1976-1978年历时3年;第三个百万条1961-1967年历时7年;第七个百万条1979-1980年历时2年;第四个百万条1968-1971年历时4年;第八个百万条1981-1982年历时2年。文献数量的激增,一方面表明文献信息资源的丰富,但同时也产生了“文献信息污染”,给人们选择、利用文献,获取所需信息造成了障碍。1.1.2文献分布集中又分散随着现代科学技术的日益综合与细化,各学科之间的严格界限日趋淡化,学科之间的相互联系、交叉渗透逐渐增强。这使文献的分布呈现出集中又分散的现象,即某一专业的大部分文章发表在少量的专业性期刊中,而另外一部分文章则刊载在大量的相关专业,甚至不相关专业的杂志中。英国文献计量学家布拉德夫发现:如果将载有某一学科相关论文的期刊按载文量多少排列,并等分为几个区,这几个区的期刊数量分别为n1、n2、n3...则有:n1:n2:n3:...≈1:α:α2:...(其中α是与学科有关的常数,α≈5)。例如利用英国《科学文摘》统计了“日本光纤通信”方面的论文322篇,共发表在66种杂志上。发现有107篇文章发表在3种杂志上(核心期刊),约有33%的文章发表在另12种期刊上(相关期刊),还有近1/3的文章则发表在另51种期刊上(边缘期刊)。文献的这种分布现象是普遍存在的,它提示人们在收集文献信息时,应首先选择本专业的核心期刊。可以使用有关的工具来了解某专业的核心期刊,如《中文核心期刊要目总览》(北京大学出版社2000年版)、《国外科学技术核心期刊总览》(2000年版)、《国外人文社会科学核心期刊总览》(2000年版)等。1.1.3文献时效性增强随着科学技术的发展,新知识、新理论、新技术、新产品层出不穷,加速了知识的新陈代谢,随之造成了文献的新陈代谢,使文献老化加速。国外有人统计各类文献的平均寿命为:图书10~20年、科技报告10年、学位论文5~7年、期刊3~5年、标准文献5年、产品样本3~5年。通常用文献的“半衰期”来描述文献老化情况。所谓文献的半衰期是指某学科领域目前尚在使用的全部文献中,较新的一半所出版的年限。国外有人统计不同学科文献的半衰期为:地理学16.1年、地质学11.8年、数学10.5年、植物学10年、化学8.1年、生理学7.2年、机械工程5.2年、社会科学5年、化工4.8年、物理学4.6年、冶金学3.9年、生物医学3年。由于各国科技发展水平不同,相应的文献寿命也不相同。1.1.4文献内容交叉重复现代科学技术综合交叉、彼此渗透的特点,导致知识的产生和文献的内容也相互交叉、彼此重复。具体表现为:1.同一内容的文献以不同文字发表。据统计,当前世界上每年翻译图书约占图书出版总量的10%;一些重要的核心期刊被译成多种文字在不同国家出版;同一项发明可以向多个国家申请专利,使专利说明书的内容重复现象严重,据世界知识产权组织统计,世界各国每年公布的专利说明书的重复率达65~70%。2.同一内容的文献以不同形式出版。据调查,会议论文有40%会后经过整理、修改发表在期刊上;有相当数量的科技报告后来发表在期刊上,如美国的NASA报告有80%、AD报告有60%、美国科学基金会报告有95%、美国农业部的科技报告有80%,既出版单行本又发表在期刊上;随着新型载体文献的普及应用,许多文献既出版印刷型的,又有缩微版、电子版等。如《纽约时报》、《泰晤士报》、《读卖新闻》等既有印刷版,又有缩微版;《中国大百科全书》、《不列颠百科全书》、《工程索引》、《科学文摘》、《科学引文索引》等既有印刷版,又有电子版。3.在激烈的商业竞争中许多畅销书内容雷同,选题重复。此外,再版、改版文献数量不断增多,如1998年我国出版图书130613种,其中新版书74719种仅占57%。1.1.5文献载体及语种增多随着声、光、电、磁等技术和新材料的广泛应用,新型文献载体不断涌现。传统的纸张型文献已失去了一统天下的局面,多种载体的文献相互依存、相互补充、共同发展已成为趋势。新型的非纸张型文献如缩微型、机读型、视听型等,或增大了信息存贮密度、延长其保存时间;或加快了信息传递与检索速度,实现了资源共享;或令人闻其声、见其形,使文献家族日臻繁荣。各国文献所用语种不断增多。据ISDS(InternationalSerialsDataSystem)1991年报道,世界上连续出版物使用的语种多达144种,常用的就有10多种,其中英文约占42%。1.2文献的类型根据不同的划分标准,文献可以分成多种类型。下面按照载体形式、加工层次、出版类型三种方式介绍不同的文献类型。1.2.1按载体形式划分为了有效地存贮、传播知识,人类先后发明了各种各样的物质材料来记录信息。古代人类的知识主要是记录在甲骨、泥板、兽皮、竹简等上面。从纸张和印刷术发明以来,人类的知识主要以纸张为载体,加以保存和传递。随着信息记录与存取技术的发展,文献载体形式呈现多样化,如音像磁带、缩微胶卷、光盘等,这些非纸型文献的出现使文献的范围进一步扩大;使文献的生产和传递更加迅速;使知识、信息的存储和利用更加便捷。目前文献主要有纸张型、缩微型、电子型、音像型等四种。1.纸张文献(PaperDocument)印刷型:以纸张为媒体,以手写、石印、油印、胶印、铅印、影印等为手段来记录知识、信息,这是传统文献的基本形式,也是目前的主要形式。其优点是读取方便,流传广泛,不受时空的局限;其不足是存贮信息密度低,占据空间大,笨重,尤其在当今信息爆炸时代,其缺点显得尤为突出。2.缩微文献(Microform)以感光材料为媒体,以缩微照相为记录手段的文献,也称缩微复制品,包括缩微胶卷,缩微胶片(或缩微平片)、缩微卡片等。其优点是信息存贮密度高,文献体积小;可节省95%以上的存贮空间,便于收藏、保存和传递,能安全贮存珍贵资料,便于管理,比印刷型文献经济实惠,某种程度上弥补了印刷型文献的不足。但此种文献的阅读必须借助缩微阅读机或其他辅助设备才能就室阅读,不便携带,保存条件要求严格,难于普及。3.电子文献(ElectronicDocument)是指以数字代码方式将图、文、声、像等信息存储到磁、光、电介质上,通过计算机或类似设备阅读使用的文献,也称机读型文献。目前电子型文献种类多、数量大、内容丰富,如各种电子图书、电子期刊、联机数据库、网络数据库、网络新闻(如Usenet,Mailinglist,BBS)、光盘数据库等。特点是信息存储量大,出版周期短、易更新,传递信息迅速,存取速度快,可以融文本、图像、声音等多媒体信息于一体,信息共享性好、易复制,但必须利用计算机才能阅读机读型:这是一种通过编码和程序设计,把文字资料转换成数字语言和机器语言,以磁性材料为存贮介质,以打字、穿孔或光学字符识别装置为记录手段,输入计算机,存贮在磁盘、磁带、光盘上,阅读时再由计算机将其内容按要求输出的文献。机读型文献近年来有了新的发展,其优点是存贮量大,查找文献快速方便;其不足是相应设备投入较大,短期内难以广泛应用和普及。4.音像文献(Audio-VisualDocument)是采用录音、录像、摄影、摄像等手段,将声音、图像等多媒体信息记录在光学材料、磁性材料上形成的文献,也称视听型文献,如音像磁带、唱片、幻灯片、激光视盘等。特点是形象、直观,尤其适于记录用文字、符号难以描述的复杂信息和自然现象,但其制作、阅读需要利用专门设备。以磁性材料或感光材料为存贮介质,借助特殊的机械设备,直接记录声音和图像,并通过视听设备存贮与播放信息知识的文献形式。如唱片、录音带等。依感官接受功能划分,视听型文献又可分为视听资料、听觉资料和视听合一的多媒体资料三种类型。其优点是,声情并茂、形象逼真、直观性强、动静交替、易于接受,在其传递信息知识方面,有着其他文献不可替代的优势。其缺点是必须借助一定的设备才能使用。1.2.2按加工层次划分人们在利用文献传递信息的过程中,为了便于信息交流,对文献进行了不同程度的加工,随之形成了不同层次的文献。1.一次文献(PrimaryDocument):是
本文标题:第一章文献信息源
链接地址:https://www.777doc.com/doc-2203601 .html