您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 数据通信与网络 > 第2讲-文献信息检索基本原理
第2讲文献信息检索基本理论学习目的要求了解信息检索系统概念了解手工信息检索系统的类型掌握手工信息检索系统的著录格式和常用的手工信息检索系统的信息检索方法掌握信息检索语言掌握信息检索语言的基本类型掌握信息检索的基本方法一、信息的搜集与选择1、确定收集的原则收集的学科范围(如机械、物理、化学等),主题范围(机床,刀具),覆盖面,信息种类,文种,时间跨度,收集的数量,摘储率2、收集的途径3、选择所需信息2.1文献信息存储过程二、信息的著录加工1、著录目的:是把一篇文献变成一条著录,压缩后必须能体现文献的外表特征和内容特征。外部特征——指文献上显而易见的,一般情况下不反映文献实质意义的那些特征,如书名、人名、各种符号标识(专利号,标准号,文献号等)、机构名等。内容特征——指表征文献实质意义的特征,如主题词(叙词,单元词、关键词)、分类号、化学符号等。2、著录内容外表特征:篇名,作者,工作单位,号码,文种出处:发表在什么刊物,刊号,卷,期,页数内容特征:摘要3、著录格式图书著录馆藏号:4418391文摘类型:RISBN号:92-828-556-SGer中图类号:TD94文献题名:NMR——SpekeropiezurstofflichenCharakterisierungvonBraunkohlenbeiderhydrierendenVeredlungMichel,D…团体作者:EuropeanCommissionBECEC出版日期:1999页:164S期刊著录记录标识:9807001记录来源:JX文献类型:刊文献题名:机械零件组成编码频率分析及设计规范化通用标准化鲍子强作者单位:长沙重型机器厂母体文献:矿山机械卷期页码:1997,No.12,p.39~42出版单位:洛阳矿山机械研究所分类号:97*TD-3*12主题词:标准化,成组技术,机械零件,设计(略)专利著录发明名称:蓖麻脱皮筛选机B07B1/20范畴分类:27F33A13A12申请人:刘国喜通讯地址:(300011)天津市河西区三水南里126幢发明人:刘国喜代理人:闫俊芬代理机构:12100天津市专利事务所专利代理服务部代理机构地址:(300051)天津市和平区成都道116号法律状态:授权说明书页数:003附图页数:02权项数:003(略)会议文献著录论文题名:从更宽阔的视野观察与思考冶金反应工程学问题曲英地址:北京科技大学,李士琦地址:北京科技大学会议名称:第七届全国冶金反应工程学术会议会议届次:7会议时间:19980515会议地点:沈阳会议主办者:东北大学母体文献:东北大学学报(自然科学版)(第19卷增刊)出版地:沈阳出版单位:《东北大学学报》编辑部出版时间:199805001~3馆藏号:H043339分类号:TF01,N94关键词:反映工程@,冶金@,系统工程,可持续发展(略)标准文献著录标准号:GB/T1990.2-98发布日期:1998-11-13标准状态:ST实施日期:1999-05-01起草单位:中国标准化与信息分类编码研究所标准名称:质量管理和质量保证标准第2部分:GB/T19001、GB/T19002和GB/T19003实施通用指南正文语种:汉语英文名称:Qualitymanagementandqualityassurancestandards-part2:GenericguidelinesfortheapplicationofGB/T19001、GB/T19002andGB/T19003稽核项:0中国标准分类号:A00标准文献著录(续)采用关系:ISO9000-2-97.IDT主题词:质量管理,质量保证,质量英文主题词:QUALITYASSURANCEQUALITYMANAGEMENTQUALITY中国申请号:98249276公告号:申请日:19981209公告日:审定公告日:19991110授权日:授权公告日:19991110学位论文著录论文题目:自控式同步电机机端电压位置监测器数字控制刘波授予学位:硕士导师姓名:李永东授予学位单位:清华大学分类号:TM762.3馆藏号:Y248534论文页数:97出版时间:1999.3主题词:自控式同步电机机端电压位置监测器数字控制(略)科技报告著录TITLE:Humanfactorsinaviationmaintenance,phase4DocumentID:19950021275N(95N27696)FileSeries:NASATechnicalReportsReportNumber:DOT/FAA/AM-95/14SalesAgency&Price:CASIHardcopyA09CASIMicroficheA02Authors:Shepherd,WilliamT.(FederalAviationAdministration)Published:May01,1995CorporateSource:FederalAviationAdministration(Washington,DC,UnitedStates)GalaxyScientificCorp.(Atlanta,GA,Unitedstates)Pages:176ContractNumber:DTFA01-94-C-01013NASASubjectCategory:MAN/SYSTEMTECHNOLOGYANDLIFESUPPORT三、信息的标引加工1、定义把文献的主要内容用非常简明的标识(即标志)表示出来。标识可以是号码(分类号),也可以是科技名词或词组(主题词),也可以是其它的。2、作用1)、相同内容的文献集中在一起,不同内容的区分开来2)、形成有序的序列,即按一定规律排列,把存储进检索工具的著录按照一定的规律排列起来,形成有序的排检系统,这样可以提供检索途径。3、标引加工的类型分类法标引用分类号作为标识主题法标引用代表文献主题内容的实质性的词汇作为标识四、信息的结构编排一般有三种排列方式1、一条著录给一个顺序编码,号码是唯一的,按号码顺序排列。号码可以表示存储地址,但通过号码文献的逻辑内容体现不出来2、分类编排,按分类号的顺序3、按主题词的字母顺序一、检索概念将信息按一定的方式组织和存储起来,并从任何信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。信息检索包括:存储与检索检索的本质:从已存储的文献资源中找出与需求相关的文献。2.2文献信息检索基本原理二、文献检索的基本原理将检索提问标识与存贮在检索工具中的标引标识相比较,两者一致或信息标识包含着检索提问标识,则含有该标识的信息就从检索工具中输出;对信息的著录是按一定规则对信息的外表特征和内容特征加以简单明确的表述,信息的标引是对其内容按一定的分类表或主题词表给出分类号或主题词;检索过程则是按同样的主题词表或分类表及组配原则分析课题,形成检索提问标识,根据检索工具所提供的检索途径,从信息集合中查找与检索提问标识相符的信息特征标识的过程。原始信息信息分析、著录和标引信息检索系统检索课题课题分析检索语言检索结果信息存贮信息检索提问标识标引标识从信息资源管理的角度讲,信息检索是从已存储的信息资源中检索出与用户提问相关的文献、知识、事实、数据的逻辑运算和技术操作过程的总和,以文献检索为本源。是一种从大量集合的文献中查找出主题及其属性符合用户要求的情报过程。查找的对象不一定就是文献,有时也可能是正在研究中的项目,或正在进行某项工作的人员与机构,或图书馆的藏书目录等,但基本原理是一致的。用户的检索提问词与数据库文献记录中的标引词进行对比,当提问词与标引词匹配一致时,即为命中,检索成功。能否准确地检索出用户所需的信息,关键在于能否准确地选择检索词。如何保证存储和检索联系一致?(检索语言)三、信息检索的类型1按检索对象分①数值检索•特征:以特定的数值为检索对象。比如,查找某一统计数据,某一数学公式,某一材料的成分、性能,某种元件的型号、参数等。•解决方案:利用手册、年鉴等参考工具书或数值型数据库来检索。②事实检索•特征:以特定的事实为检索对象。比如,查找名词术语的解释,了解某人或某机构的简况,或考证某一事件发生的前因后果等。•解决方案:利用辞典、百科全书、年鉴、名录等参考工具书或事实型数据库来检索。③文献检索•特征:以特定的文献为检索对象。比如,查找有关某一研究课题的一定年限内的相关文献,或从事一项发明创造而需要文献查新等。•解决方案:利用文摘、题录等各种手检工具书或书目文献型数据库来检索。2按检索手段分手工检索计算机检索--光盘检索--联机检索--网络检索四、检索语言为沟通文献标引与文献检索而编制的人工语言,是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道,是用于文献标引和检索提问的约定语言。如果没有检索语言作为标引人员和检索人员的共同语言,就很难使得标引人员对文献信息内容的表达和检索人员对相同文献信息内容需求时的表达取得一致,信息检索也就不可能顺利实现。编制检索语言的目的:不但能够保证不同的标引人员描述文献特征的一致性,而且能够保证检索提问词与文献标引词的一致性。检索语言:标引员与检索员之间的约定语言。提供检索所需的文献特征。检索标识:描述文献特征,且专门用于情报检索的符号。标引:把文献的主题内容和某些具有检索意义的特征,用检索标识表示出来的过程。检索标识(检索语言)反映文献外部特征检索标识反映文献内容特征检索标识著者文献号(如:专利号、标准号、报告号、ISBN号、ISSN号)其他(如:题名)分类号主题词关键词单元词标题词叙词规范语言自然语言主题词语言分类语言1分类语言以学科体系为基础,用号码作为概念标识,按分类编排的检索语言。国内外比较重要的分类语言表:《国际专利分类表》《杜威十进分类法》《中国图书馆图书分类法》《中国科学院图书分类法》等。主要特点:按学科专业性质集中图书区分不同性质的图书;集中性质相同的图书性质;相近的放在相近的位置;按照远近亲疏的关系把图书组成为一个有条理的体系;提供从学科分类查找图书的途径。(1)分类法—中图法将图书分为社会科学、自然科学、综合三大类。类目展开之式见下图。分类标识即分类号,由字母和数字组成采用等级列举表达从属关系上位类目与下位类目的关系:上位类目一定能包含其各个下位类目,而下位类目一定带有上位类目的属性。分类号越长,表示的学科范围越窄。为了清楚醒目,通常在分类号的第三位数字后,隔以,如F279.712,TQ032.4《中图法》的分类原则根据当前社会科学和自然科学所包括的学科多、发展快等特点,按图书学科内容作为分类的主要标准与依据。将图书在五个基本部类的基础上分为22个大类,分别以拉丁字母A—Z表示。C社会科学总论D政治、法律E军事F经济G文教、科学、体育H语言J文学I艺术K历史、地理自然科学总论NRSTO数理化P天文学、地球科学Q生物科学医药、卫生农业科学工业技术U交通运输V航空、航天X环境科学Z综合性图书社会科学自然科学机械、仪表建筑科学马列主义、毛泽东思想A马列B哲学哲学综合TBTDTETFTGTHTJTLTKTMTNTPTQTSTUTV一般工业技术矿业工程石油冶金工业无线电、电子学、电讯技术自动化计算化学工业轻工业、手工业金属学武器工业动力工程原子能技术电工技术水利工程实例:按中图分类法检索1检索各类期刊目录(北京国图书刊)2检索图书(赢海书店)(2)中图法-索书号(callnumber)反映了图书的具体排列次序和存放位置组成:分类号+书次号分类号:按学科分类图书书次号:区分同类图书,两种取法:种次号:按图书到馆的先后顺序给予号码。缺点:会使同一著者的同一类著作排放在不同位置。著者号:按著者名称(代码)来区分同一分类号下的不同文献。索书号是识别一种图书的唯一标识,图书馆同一分
本文标题:第2讲-文献信息检索基本原理
链接地址:https://www.777doc.com/doc-1732682 .html