您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 华科信息检索课件第一讲-信息检索概论
L/O/G/O第一讲信息检索概论刘畅【目的与要求】•了解信息检索有关概念•熟悉各类型信息源、信息检索语言【重点】•各类型信息源、信息检索语言【难点】•信息检索语言•知识与信息(视频)几个基本概念的辨析(1)信息(information,inform带有指令性)•“信息是用来消除随机不定性的东西。”—美国数学家、信息论创始人申农,1948•“信息就是信息,既非物质,也非能量。”—美国数学家、控制论创始人维纳,1948(2)文献•“文,典籍也;献,贤也”——宋,朱熹•“在存贮、检索、利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存贮有信息或数据的载体”——ISO《文献情报术语国际标准》•“文献是记录有知识和信息的一切载体。”——《中华人民共和国国家标准·文献著录总则》(3)情报•情报是指被传递的知识或事实,是知识的激活,是运用一定的载体,越过空间和时间传递给特定用户,解决科研,生产中的具体问题所需要的特定知识和信息。(4)知识中国古代:智慧、学问•“士虽有学,而行为本焉”——《墨子﹒修身》•“吾有知乎哉?无知也”——《论语、子罕》•现代知识社会:“知识是对事实或思想的一套有系统的阐述提出合理的判断或经验性的结果,它通过某种交流手段,以某种系统的方式传播给其他人。”——美国学者丹尼尔,20世纪70年代内涵:关于事实与思想的陈述;这些陈述能提出合理判断或实证结果;它们可通过传媒传递给他人四个概念间的关系:Titleinhere情报文献知识信息信息与知识:今天最低气温是0摄氏度水在0摄氏度时结冰知识可被视为载有经验、评价、敏锐洞察力的信息。文献与知识:文献记录的知识仅仅是显性知识,隐性知识是无法记录的。情报与知识:情报不一定属于知识的范畴,有些情报可以属于知识,是知识的一种,有些情报未必是知识。文献与情报:不是所有文献都能成为情报,所有情报也不都能记载在文献中。概念例子通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。二次文献一次文献期刊论文、科技报告、会议论文、专利说明书等是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。目录、题录、文摘、索引、各种书目数据库等是指利用二次文献,选用一次文献内容,经综合、分析和评述后形成的指南性文献。综述、述评、字词典、百科全书、年鉴、标准、数据手册、指南数据库等三次文献检索的手段对象+工具检索的对象图书(book)按照联合国教科文组织的定义,图书是指50页以上的以印刷方式单本发行的出版物。特点:内容全面系统,基础理论性强,论点成熟可靠。如果需要对大范围问题获得一般性知识,对陌生问题进行一般了解,对熟悉问题进行历史性的全面系统的回顾,查阅图书一般来说是行之有效的办法。但图书传递信息速度慢,内容相对陈旧。阅读型:教科书(Textbook)、专著(Monograph)、文集(Anthology)等工具型:词典(Dictionary)、百科全书(Encyclopedia)、手册(Handbook)、年鉴(Yearbook)等图书分类胡健颖,冯泰编著.实用统计学.北京②:北京大学出版社①,1996③,471页④,ISBN7-301-03086-x⑤JavierNogueras-Iso,F.J.Zarazaga-Soria,P.R.Muro-Medrano.GeographicInformationNetadataForSpatialDataInfrastructures-Resources,Intero-perability,InformationRetrieval.SpringerVerlag①,Germany②,ISBN:3-540-24462-6⑤,264pages④,March2005③图书著录格式号的说明•2007年前使用10位ISBN号:7-301-07388-7•第一组号码是地区号,又叫组号,最短的只有一位数字,最长的达五位数字,大体上兼顾文种、国别和地区。0、1代表英语,使用这两个代码的国家有:澳大利亚、加拿大、爱尔兰、新西兰、波多黎各、南非、英国、美国、津巴布韦等;2代表法语,法国、卢森堡以及比利时、加拿大和瑞士的法语区使用该代码;3代表德语,德国、奥地利和瑞士德语区使用该代码;4是日本出版物的代码;5是俄罗斯出版物的代码;7是中国出版物使用的代码。第二组:出版社代码。由国家或地区的ISBN中心设置并分给各个出版社。第三组:书序码。该出版物代码,是出版者分配给每一个出版物的编号。第四组:计算机校验码。校验码是ISBN号的最后一位数值,它能够校验出ISBN号是否正确。校验码只能是1位数,当为10时,记为罗马数字X。••2007年后使用13位ISBN号:•978-7-301-12957-9•ISBN从10位数系统改为13位数系统主要是为了增加ISBN的编号容量,“978”“979”•2007年1月1日以前,各国ISBN机构尚没有分配完的10位的ISBN可以在前面加前缀978,一旦现有的10位的ISBN号用完了,新申请的ISBN号码全部以979开始。979前缀目前主要用于两种情况:一是新建出版社首次申请ISBN和现有出版社在2007年1月1日以后申请ISBN号,二是如果以978为前缀的号码先用完,那么就只能用979。图书出版信息检索工具:《全国新书目》《全国总书目》《新华书目报》《出版社目录》各图书馆目录信息检索系统网上书店:亚马逊网上书店当当书店上海书城数字图书馆:美国国会图书馆中国国家图书馆上海图书馆其它数字图书馆(书生、超星、Apabi等电子图书)期刊(Journal)特点:内容新颖、信息量大、出版周期短、传递信息快、传播面广、时效性强用途:获取最新研究成果和动态目前,全世界每年出版各类期刊达15万种以上,科技期刊约占10万种。我国现有期刊9000多种,其中科技期刊占54%。据统计,科研人员从期刊中得到的信息约占65%以上,是十分重要的情报源。定期或不定期周期性出版的连续出版物。期刊的分类学术性:一般性期刊(Journal),纪事(Chronicle),年刊(Annual),汇刊(Transactions),各种学报(Acta)、通报(Bulletin)、评论(Reviews)、进展(Progress)等快报性期刊:通讯(Communication)、快报(Letters)、短讯(News)等检索性期刊:index,Abstract核心期刊某学科(或某领域)的核心期刊,是指那些发表该学科(或该领域)论文较多、使用率(含被引率、摘转率和流通率)较高、学术影响较大的期刊。中文核心期刊目前,判断中文期刊是否核心刊有以下三种标准1北京大学图书馆主编的《中文核心期刊要目总缆》2中信所的《中文科技期刊引证报告》3南京大学的《中文社会科学期刊引证报告》以下两个也可以参考4中国科学引文数据库CSCD(限于理工科期刊)。它是由中国科学院文献情报中心建立的,分为核心库和扩展库。5《中国人文社会科学核心期刊要览》。它是由中国社会科学院文献信息中心和社科文献计量评价中心共同建立的核心期刊库。外文核心期刊:期刊影响因子(ImpactFactor)指在两年内某期刊上发表的所有文章被引用的总次数与这两年该期刊上所发表的文章总数的比值.影响因子=(该刊前两年发表论文在统计当年被引用的总次数)/(该刊前两年发表论文总数)。比如:《Science》杂志1996年的影响因子计算方法:1995年共出版文献1037篇,1994年共发表文章1054篇。1995年的文章在1996年被引用24189次,1994年的文章在1996年被引用25170次。1996年的影响因子=(24189+25170)/(1037+1054)=23.605•可以较公平地评价各类期刊,避免了不同创刊期、不同载文量带来的不公平。•影响因子越大,期刊质量也越高。《中文科技期刊引证报告》、《中文社会科学期刊引证报告》可以查中文刊物的影响因子。被SCI收录的刊物影响因子可以检索JCR(JournalCitationReport)我国正式出版的期刊都有国内统一刊号(CN),它是由地区号、报刊登记号和《中图法》分类号组成。如CN11-2746/G25。地区号依《中华人民共和国行政区划编码表GB2260-82》取前两位,如北京为11、天津12、上海31、辽宁21、吉林22等。期刊类型的常用冠名也是辨识期刊的直接关键词。ISSN(国际标准刊号)由8位数字分两段组成:期刊代号+校验号(末位),如:ISSN1001-8867为《中国图书馆学报》的国际标准编号。期刊检索工具《中国期刊网全文数据库》(CNKI)《中文科技期刊全文数据库》(维普)《中国数字化期刊群》(万方)中国国家科技图书文献中心(NSTL)的期刊数据库IEEE/IEEEBSCOElsevierSDOL(ScienceDirectOnline)ProQuestOVID信息量大传递快传播面广现实感强以刊载新闻和评论为主的出版周期较短的定期连续出版物。【特点】3.报纸CNKI中“中国重要报纸全文数据库”可以检索2000年至2008年的中文报纸信息会议文献(conferencepaper)特点:内容新颖、专业性和针对性强,传递信息迅速,能及时反映科学技术中的新发现、新成果、新成就以及学科发展趋向。用途:了解有关学科发展的动向会前文献:会议论文预印本、会议论文摘要会后文献:是会后经整理出版的文献,如会议录(Proceedings)、会议论文集(Symposium)、会议论文汇编(Transactions)、会议丛刊、丛书是指在各种学术会议上交流的学术论文。学位论文(Thesis,Dissertation)是指高等学校或研究机构的学生为取得某种学位,在导师的指导下撰写并提交的学术论文。识别依据:学位名称、学位授予机构吕玉龙.基于双聚类的基因表达芯片分析.[硕士].上海大学,2009.2005,Tsai,Hwai.PricingDiscreteDouble-BarrierOp
本文标题:华科信息检索课件第一讲-信息检索概论
链接地址:https://www.777doc.com/doc-4244418 .html