您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第二章信息海洋冲浪的基本方法与技巧―“掌握”航海工具箱
信息海洋冲浪的基本方法与技巧—“掌握”航海工具箱2主要内容工具箱——检索系统工具箱——信息检索工具箱——检索语言3信息检索信息检索的概念信息的存储过程信息的检索过程42020/1/204一、信息检索一次文献二次文献为什么要进行信息检索?5概念——引例一、信息检索——引例汽车燃料中国图书馆分类法交通运输类(U)汽车用燃料、润滑料类(U473)中国图书馆分类法6一、信息检索——引例广义信息检索:包括信息存储与查找两个过程狭义信息检索:指信息的查找。信息检索(informationretrieval):指的是从信息资源集合中查找所需信息的具体过程。7——引例U473/12汽车用燃料、润滑料类U473交通运输类UU473/12U473U书的信息存储过程书的信息查找过程例如:《车用替代燃料与生物智能》82020/1/208主题的分析各类信息资源信息检索语言数据库文档、超文本文档等等匹配过程信息需求分析信息检索语言用户查询表示信息资源线索检索出的信息二、信息检索原理92020/1/209二、信息检索原理信息汇集是指对杂乱无章的各类信息资源加以组织和控制,使之有序化的过程。对收集的资源进行外部特征(标题名、作者、发表日期、期刊名等)和内容特征(主题、关键词)分析按照检索语言(主要是主题词表和分类表)及其使用规则,对每条原始信息进行处理,形成一系列信息特征标识,组成一条记录。10二、信息检索原理目录文摘索引编制概念转换主题分析信息源信息集合存储标识信息汇集112020/1/2011二、信息检索原理信息存储是将有序化的信息资源进行存贮的过程,将许多条记录形成有序的信息集合。数据库文档存储超文本文档存储122020/1/2012二、信息检索原理信息查找是指从这些有序化的信息资源的存储系统中查找出专门信息资源的活动、方法与程序。信息需求分析——按照同样的主题词表或分类表分析检索需求,形成检索提问标识检索途径——依据信息存储时所形成的检索途径,从信息集合中查找与检索提问标识匹配的信息特征标识。检索技术13二、信息检索原理目录文摘索引概念转换主题分析信息需求信息集合检索标识信息查找14检索系统检索系统的概念检索系统的分类15一、检索系统的概念信息检索系统:由一定的设备和信息集合构成的服务设施称为信息检索系统。例如:中国期刊网(CNKI)、在线公共目录检索系统(OPAC)、工程索引(EI)16二、检索系统分类检索系统目录检索系统全文检索系统文摘检索系统171、目录检索系统目录检索系统:用于对出版物进行报道和对图书资料进行科学管理。常用目录检索系统:在线公共目录检索系统(OPAC)、中国高等教育文献保障系统(CALIS)联合目录公共检索系统18目录检索系统OPAC信息素养19目录检索系统检索结果20目录检索系统CALIS信息素养21目录检索系统22目录检索系统23目录检索系统24目录检索系统25目录检索系统26目录检索系统改变检索策略也没有。272、文摘检索系统文摘检索系统:用于对信息题录和文摘的检索,检索结果一般是文献的来源信息。常用文摘检索系统:工程索引(EI)、引文索引(SCI)、中文社会科学引文索引数据库(CSSCI)28文摘检索系统EI数据库检索词选择字段29文摘检索系统检索结果√√30文摘检索系统313、全文检索系统全文检索系统:全文也包括内容简短的事实和数据,全文检索系统集文摘检索与全文提供于一体。常用的全文检索系统:中国知网(CNKI)、万方数字资源系统、超星数字图书馆、SpringerLink期刊图书系统、UMIProQuest博士论文全文数据库32全文检索系统CNKI33全文检索系统检索结果34全文检索系统35检索系统小结全文用户提问全文检索系统目录检索系统文摘检索系统收藏地来源信息馆藏信息36检索语言检索语言基础知识检索语言的分类检索运算符37一、检索语言的基础知识检索语言概念作用检索原理381、检索语言的基础知识(概念)信息检索语言:用于描述信息系统中信息的内容特征和外表特征,并可以表达用户提问的一种专门语言。通常检索语言用来描述信息资源的外部特征和内部特征、表达信息内容主题及相互的关系、对自然语言作规范化处理(指对同义词、多义词、近义词、同形异义词进行统一限制或合并,使之达到一词一义,以表达概念的惟一性)、表达主题提问以便于将检索标识和提问特征进行比较。作用:信息存储信息检索检索语言392、检索语言的基础知识(作用)文献存储子系统文献检索子系统信息群主题分析编制目录文摘索引概念转换概念转换主题分析查找用户群信息集合著录标引过程检索语言目录数据待标文献特征标识主题概念用户提问主题概念检索标识编制检索策略过程403、检索原理信息检索的原理:用检索标识与信息的存储标识相比较,若取得一致,则为匹配,即可得到命中文献。信息存储信息检索检索语言414?需要检索语言由于职业、知识水平、个人素质甚至习惯等因素的差异,信息汇集与存储人员(标引者)与信息检索用户(检索者)对同一信息的分析、理解也会存在不同。比如《计算机在生物化学中的应用》一文,标引者可能将其归入“生物化学”类,而检索者则可能在“计算机”类查找该文。这样,标引者与检索者之间发生了标引错位,存储的信息就无法检索到。怎样才能保证信息存得进又取得出呢?那就是存储与检索所依据的规则必须一致,也就是说,标引者与检索者必须遵守相同的标引规则(信息检索语言)。这样,无论什么样的标引者,对同一篇文献的标引结果一致,不论是谁来检索,都能查到这篇文献。42二、检索语言的分类外部特征书名/刊名著者名/团体著者出版事项代码/序号检索语言内部特征分类语言分类表主题语言主题词表43检索语言的分类按构成原理划分分类语言主题语言441、分类语言分类语言:是以号码为基本字符,用分类号和类目表达文献主题概念的检索语言。特点:是用分类号表达各种概念,根据概念之间的关系,把它们组织成一个逻辑体系。45分类语言作用:1.反映知识的分类或社会实践活动的职能分工,具有较好的系统性。2.把同一学科、同一专业、同一职能活动的文献集中在各个类目之下,满足族性检索(类检索)需要。46分类语言分类语言的具体表现形式是分类表,如在国内图书馆常用的《中国图书馆分类法》。分类表的作用:指导存储文献,正确标引出分类号适用于从分类的角度检索某一类的文献47分类语言国内:《中国图书馆分类法》《科学院图书馆分类法》《人民大学图书馆分类法》国外:《杜威十进分类法》(DeweyDecimalClassificationandRelativeIndex)《美国国会图书馆分类法》(LibraryofCongressClassification)48分类语言基本大类A马克思主义、列宁主义、毛泽东思想B哲学C社会科学总论D政治、法律TB一般工业技术E军事TD矿业工程F经济TE石油、天然气工业G文化、科学、教育、体育TF冶金工业H语言、文字TG金属学、金属工业I文学TH机械、仪表工业J艺术TJ武器工业K历史、地理TK动力工程N自然科学总论TL原子能技术O数理科学和化学TM电工技术P天文学、地球科学TN无线电电子学、电信技术Q生物科学TP自动化技术、计算技术R医药、卫生TQ化学工业S农业科学TS轻工业、手工业T工业技术TU建筑科学U交通运输TV水利工程V航空航天X环境科学、劳动保护科学Z综合性图书中图法49分类语言自然科学总论N.自然科学总论……T.工业技术X.环境科学、安全科学TB一般工业技术……TP自动化技术、计算机技术……TV水利工程TP3计算技术、计算机技术TP39计算机的应用TP393计算机网络TP393.09计算机网络应用程序中图法50分类语言TN0308索书号51分类语言索书号TN0308V24/E:08(E)V2408种次号文种号(E,J,R,G)分类号(A,B,C,D,E,F,G,H,I,J,K,N,O,P,Q,R,S,T,U,V,X,Z)TN03/08英日俄德522、主题语言主题语言:是一种描述语言,即用自然语言中的名词、名词性词组或句子描述文献所论述或研究的事物概念。例如:我们在搜索引擎中查找文献时输入的“汽车燃料”、“信息素养”就是主题语言的一种。53主题语言特点:直接用词语来表达各种概念。它以词汇规范化为基础,通过概念组配用以表达任何专指概念。具有较好的专指性,便于特性组配检索。直指性强,专指度高的特点。54主题语言叙词:最有代表性的主题语言,由规范化的概念及其指代关系组成。叙词表常用主题语言关键词:题目、摘要、原文中出现的,对表述文献主题内容有实质意义的词汇,是未经规范化的自然语言词汇。55叙词词表中的关联关系Y(用)USE指引正式主题词D(代)UF指引非正式主题词S(属)BT指引上位主题词F(分)NT指引下位主题词C(参)RT指引相关主题词Z(族)CC指引族首主题词(最上位词)56……FeijizaoshengWuranyuan飞机噪声污染源*AircraftnoisePollutionsourceD航空噪声F臭气源F轰声点污染源S噪声源电磁污染源Z污染源*放射性污染源C交通噪声非点污染源…工业污染源…固定污染源Hangkongzaosheng农业污染源航空噪声热污染源(增词时间:1989年)移动污染源Aircraftnoise噪声源Y飞机噪声C污染物*…………HongshengZaoshengyuan轰声噪声源SonicboomNoisesourceS飞机噪声F电器噪声Z污染源*飞机噪声…火车噪声叙词表编排体系结构举例非正式主题词下位词上位词族首词相关词正式主题词572020/1/2057关键词关键词语言:从正文、摘要、题名等中抽出的在表达文献内容主题方面具有实在意义的起关键作用的词汇。如:“电子计算机在企业信息工作中的应用”规范前的关键词——电子计算机、信息工作、企业、应用规范后的关键词——计算机、企业信息工作如:在上叙词表中的航空噪声、交通噪声、飞机噪声都是关键词58三、常用检索运算符号例如:检索关于“流动换热的湍流模型”的文献“湍流模型”和“流动换热”59检索提问式检索提问式:是检索策略的具体表达,是用检索系统规定的各种算符将各个检索条件连接而形成的一种逻辑表达式。60检索运算符号概念检索运算符:在计算机检索系统中,为了制定一个计算机可识别的检索方案,这就需要计算机信息检索系统规定使用的组配符号(也称为算符operator)。湍流模型“+”流动换热61常用检索运算符号布尔逻辑算符通配符与截词符字段限制符621、布尔逻辑算符逻辑与:表示命中结果为同时满足条件A和B逻辑非:表示命中结果为条件A中不包含条件B的部分逻辑或:表示命中结果为满足条件A或BNOTANDOR63逻辑非假设有两个检索项A和BNOT检索式表示为:ANOTBABNOTANOTB64逻辑非逻辑非(NOT)65逻辑非66逻辑与假设有两个检索项A和BAND检索式表示为:AANDBABANDAANDB67逻辑与68逻辑与69逻辑或假设有两个检索项A和BOR检索式表示为:AORBABORAORB70逻辑或71逻辑或72布尔逻辑算符小结9290922192194逻辑非:逻辑与:逻辑或:732、通配符和截词符通配符和截词符主要用于西文电子资源的检索,不同检索系统使用的种类和含义可能会有所不同。74通配符和截词符以EI为例算符含义结果*利用它可以只输入检索词的起始部分,而实现一簇词的检索Alter*可命中alter、alternando、alternant、alternate、altercate等$自动取词根运算符$alter可命中alter、alterant、alterable753、字段限制符限定检索字段即是指定检索词出现在记录中的哪一个字段。常用的字段限制符有前缀字段限制符和后缀字段限制符。76字段限制符77字段限制符782020/1/2078加权检索,就是在检索时给每个检索词一个表示其重要程度的数值即所谓“权”,对含有这些检索词的文献进行加权计算,其
本文标题:第二章信息海洋冲浪的基本方法与技巧―“掌握”航海工具箱
链接地址:https://www.777doc.com/doc-3204316 .html