您好,欢迎访问三七文档
文献检索复习要点—Jinying第一章绪论信息、知识、情报及三者关系;文献,文献按载体划分,文献按出版形式划分,文献级次(各级次的概念、代表文献及异同);ISBN和ISSN(概念、组成及检验方法)信息含义:是客观事物本质特征千差万别的反映。是物质存在方式、形态或运动状态的反映。(P3-P4)知识的概念:是人类通过信息对自然界,人类社会及思维方式与运动规律的认识与概括,是人的大脑通过思维重新组合和系统化了的信息,是信息中最有价值的部分。情报的定义:为了解决一个特定问题从一定文献资料中提取或经过传递获得的知识。情报的三个基本属性:知识性传递性针对性信息,知识,情报之间的关系从信息,知识和情报的定义可以看出,信息无处不在,信息的范围很大,信息中被人们认识的部分成为知识,而知识中被人们用来解决问题的部分成为情报,因此信息,知识和情报的关系是前者包含后者的关系。ISBN:(P8)概念:即国际标准书号,它是由10位数字组成,共分4段,其间用“—”相连,组成:1组号2出版社号3书序号4校验码算法:用1分别乘ISBN前12位中的奇数位,用3乘以偶数位,所得结果之和除以10可得,值的范围为0—9文献的含义:记录有知识的一切载体,包含知识内容、信息符号、载体材料、记录方式四个基本要素(P5)文献按载体划分:1印刷型2缩微型3视听型4电子型(P5-P6)文献按出版形式划分:1.图书2.连续出版物(期刊、报纸)3.会议文献4.学位论文5.科技报告6.专利文献7.标准文献8.政府出版物9.产品样本10.技术档案(P7-P11)文献级次:人类开发、利用文献的先后顺序。(P6-P7)1零次文献:非正式出版物或非正式渠道的最原始的文献。如日记、手稿、个人通信、口头言论2.一次文献:依据作者本人的研究或研制成果创作的文献。如图书、期刊论文、会议论文3二次文献:按一定的方法对一次文献进行整理加工,使之有序化而形成的文献。如目录、索引、文摘4三次文献:围绕某个专题或出于特定目的,根据二次文献提供的线索,选用大量一次文献的内容,进过筛选分析综合和浓缩等深度加工而形成的文献。如进展报告、教科书、字典、百科全书各级次异同:从零次文献、一次文献、二次文献到三次文献,它是一个由分散到集中,由无序到有序,由博而略的对知识信息进行不同层次的加工过程。它们所包含的信息的质和量是不同的,对于改善人们的知识结构所起的作用也是不同的。零次和一次文献是最基本的信息源,是文献信息检索和利用的主要对象;二次文献是对一次文献的集中提炼和有序化,它是文献信息检索的工具;三次文献是把分散的零次文献、一次文献、二次文献,按照专题或者只是的门类进行综合分析加工而成的成果,是高度浓缩的文献信息,在内容上具有综合性,在功效上具有参考性。ISSN:(P9)概念:国际标准连续出版物编号,由8为数字组成,分2段,每段4位数字,中间用“—”隔开,组成:前7为是刊名代号,末位是计算机校验位。算法:前7位按顺序分别乘以8、7、6、5、4、3、2,将这些乘积之和再加上校验号,如果能被11整除,则正确。第二章文献检索基础知识信息检索;信息检索的类型;图书的四大常用检索点;检索语言的基本种类;图书在版编目(并列书名、数据检索项);最早的图书分类法;四库全书、全球使用最广的分类法;《中图法》(基于22大类的分类;排架的方法);文献的内外部特征;文献检索的方法;文献检索的程序(从检索程序入手,就一个检索课题如何利用纸本文献、数据库、网络资源全面搜集资料);查全率和查准率(概念及计算方法)信息检索概念:是指把文献按一定方式组织和存储起来,并针对用户的需要找出所需文献的过程。包括信息组织和信息检索两个过程。狭义的文献检索,即后一个过程---信息检索。(P12)信息检索的类型:按照检索对象的不同,可分为:文献检索、数据检索和事实检索按照检索方式的不同,可分为:手工检索和计算机检索(p13)图书的四大常用检索点:1书名(题名)2作者3主题词4分类号(p19)印刷格式中看出检索语言的种类:1分类语言2主题语言。分类语言按事物的学科属性或知识属性集中,主题检索语言按特定的事物、问题、现象,即以主题为中心集中(p19)图书在版编目:并列(丛)书名的标识符为“=”;检索数据的排印次序为:书名检索点、作者检索点、主题词、分类号。各类检索点用罗马数字加下圆点排序。各类之间留一个汉字空。除分来号外,同类检索点用阿拉伯数字圈码排序。分类号不止一个时,各个分类号之间留一个汉字空,但不用任何数字或符号排序。书名、作者检索点采用简略著录法,即仅著录书名、作者姓名的首字。其后用“…”表示。最早的图书分类法:西汉刘向父子的《七略》(p20)四库全书分类体系:“经、史、子、集”四部分类体系《四库全书》即是四部分类体系实践应用中的一个典范。(P20)全球使用最广的分类法:《杜威十进分类法》(p21)22大类:A马列毛邓B哲学C社会科学总论D政治法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史地理N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药卫生S农业科学T工业技术U交通运输V航空航天X环境科学、劳动保护科学,Z综合性图书(p23)排架的方法:1排序(1)按基本大类排(2)如基本大类同,由2级类目排列,以此类推2.书签(索书号)(老师补充的笔记)文献文献检索的方法:1常用法(顺查、倒查、抽查)2追溯法(从已有的文献后所列的参考文献着手,逐一追查原文,再从这些原文后所附的参考文献逐一检索,获得一批相关文献的方法)3循环法(常用法和追溯法结合:既要利用一般检索工具书刊,又要利用文献后附的参考文献进行追溯,分期分段的交替使用)(p27)文献的内外部特征:检索途径分为以文献内容特征进行检索的两大主流检索途径(分类途径和主题途径)和以文献外部特征进行检索的基本途径(如:责任者、文献名、文献原有序号、文种、发表时间、出版单位等)两大类。文献检索程序:1分析待查项目,明确主题概念2选择检索工具3确定检索途径和检索标志4查找文献线索,索取原文(p30)查全率:即命中率、检全率、召回率,指系统实施检索时检出的与某一检索提问相关的信息资源数与检索系统中与该问题相关的实有信息资源总数之比。查全率=检出相关信息资源量/系统相关信息总量*100%(p31)查准率:即检索精度、检准率、相关率,指系统实施检索时检出的与某一检索提问相关的信息资源数与检出的信息资源总数之比。查准率=检出相关信息资源量/检出信息总量*100%(p31)第三章计算机信息检索基础知识计算机检索经历四个阶段;学会提炼检索词;布尔检索及逻辑组配;检索策略(概念、扩检、缩检,检索课题的分析)计算机检索发展阶段:1脱机检索阶段(巨型机阶段):主要用于科学领域2联机检索阶段(单向联机):以电话联机为主,成本高,开始商业化应用。3光盘检索:存储作用4网络检索:以TCP/IP协议为主。(P34)布尔检索与逻辑组配:1.或(OR)运算符,也可用“+”代替。A或B或C;AORBORC;A+B+C扩大检索范围。Eg:A=100,B=30,则A+B=1302.与(AND)运算符,也可用“*”代替。缩小检索范围,提高准确率。3.非(NOT)运算符,也可用“—”代替。缩小检索范围。(P39)检索策略:概念广义的检索策略是为实现检索目标而制定的全盘计划或方案,指导整个检索过程。狭义上的检索策略是指检索式,检索式是用来表达用户提问的逻辑表达式,是对多个检索词之间的相互关系和检索顺序做出的某种安排,是整个检索策略的综合体现。(P50)扩检:一般将设置的检索范围太小,命中文献不多,需要扩大检索范围的方法称为扩检。(P55)缩检:将设置的检索范围太大,命中文献太多,需要减少检索范围的方法称为缩检。(P55)第四章互联网信息检索的基础知识IP、DN、URL(三者的概念、组成及在检索中的运用);搜索引擎的概念;按信息搜集方法和服务提供方式,搜索引擎可分为那几类,每种类型的定义,优缺点是什么,每类的代表搜索引擎有哪些;搜索引擎的系统结构;布尔检索技术在搜索引擎中的应用;site,inurl,intitle,filetype等检索语法的使用;网页快照的概念和使用;精确检索、二次检索、网页快照、高级检索等实际检索的应用;熟悉百度和GOOGLE的基本检索和高级检索、百度的文库和文档、GOOGLE的学术搜索引擎IP:互联网协议地址,每台正式入网的计算机都有一个唯一的ip地址,这个ip地址由4个字节共32位数字串组成,这4个字节用小数点分隔。每个字节的取值范围是0~255。(P63)DN:域名,是用字符串的组合来表示ip地址,适当的选择域名中的字符串可以使域名有一定的可读性。只有作为服务器的计算机才需要DN。结构:一般由2~5段字符组成,采用层次结构,每一层次构成一个子域名,各子域名之间以圆点分隔,形如:主机名.三级域名.二级域名.顶级域名。(P64)(补充:顶级域名:1按组织管理的层次结构划分,如net表示网络提供商,org表示非盈利组织,com表示工商企业。2以国别地理区域划分,如cn中国,jp是日本,un是英国)URL:统一资源定位器,是用于互联网中按照统一方式来指明和定位一个资源的地址,由协议方式、主机的ip地址、端口、路径、文件名构成。书写形式为“协议://IP地址(或域名):[端口]/路径/文件名”。(P65)搜索引擎:就是互联网上的一种网站。又称搜索机器,是网上的导航工具,是一种搜索信息的软件(P66)(补充:搜索引擎工作程序:1信息采集和储存2索引数据库的建立3检索界面的建立4检索结果的相关性处理)按信息搜集方法和服务提供方式,搜索引擎可分为三大类:(P71-P75)1目录式搜索引擎。全称是分类目录式搜索引擎,常又被称为主题指南、专题指南、列表查询引擎、站点导航系统等。优点:信息准确,导航质量高。缺点:需要人工介入,维护量大,信息量少,信息更新不及时。典型代表:YAHOO,新浪分类目录。2机器人搜索引擎。也称作全文检索型搜索引擎,有些文献中谈到的独立搜索引擎主要是这一类。优点:信息量大,更新及时,无需人工干预。缺点:返回信息过多,可能有很多无关信息。典型代表:Google,百度,北大天网。3元搜索引擎。也称多元搜索引擎,这类搜索引擎本身没有存放网页信息的数据库,靠集成多个独立搜索引擎运行。优点:可以同时获得多个源搜索引擎的结果,信息量大且全。缺点:在信息来源和技术方面都存在一定的限制,对检索结果的控制能力较低。典型代表:Dogpile搜索引擎的系统结构:1.搜索器、2.索引器与索引数据库、3.检索器、4.用户接口(P77)基本检索语法:1布尔检索2范畴检索(1)Site:按网域搜索。例:[三峡旅游site:com],表示在商业性网站上搜索含有三峡和旅游的网页(2)Inurl:按URL搜索。例:[inurl:mp3宋祖英]表示宋祖英必须在网页的任何位置出现,而MP3则必须出现在网页的URL中(3)Intitle:按网页标题搜索。[intitle:三峡文化],表示在网页标题中搜索包含“三峡文化”的网页。(4)Filetype:按文件格式查找文件。例[线性代数filetype:PPT],表示返回文件类型为PPT格式的关于线性代数的教案3短语检索(引号“”)(P85-P87)二次检索:可以锁定搜索的范围,它指的是在当前搜索结果的基础上再进一步的查找,相当于and的功能,但在使用上更具有灵活性。(P88)网页快照:直接在搜索引擎数据库缓存中调出的该网页的存档文件。“快照”服务器速度很快,搜索项均用不同颜色标明。(P88)第五章数据库基础与应用数据库的类型;掌握我馆所有的正式数据库中的本地镜像数据库(各自的文献收录类型,如那些是期刊数据库,那些是图书数据库;那些是硕博论文数据库;那些是视频数据库;一般检索和高级检索方法;提供的检索途径;文献全文提供的格式;对应的阅读器;文字识别方法;CNKI、维普万芳硕博作为重点);熟悉我馆重要的远程访问数据库(EBSCO、Springerlink、超星读秀);掌
本文标题:文献检索复习资料
链接地址:https://www.777doc.com/doc-7085339 .html