您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 第7讲 联机检索与网络
第7讲联机检索与网络查询什么是数据库?联机检索的构成与使用方法;重要的联机检索系统;网络资源的类型与特点;搜索引擎的构成与发展;搜索引擎的使用技巧1.数据库的类型、发展与构成狭义的数据库是指在计算机存储装置上合理存放的有一定结构的相互关联的信息集合体;广义的是指DBMS。数据库的类型划分数据库的形成与发展数据库的文档与索引1.1数据库的类型划分国际上:Referencedatabases,引导用户到另一个信息源以获得原文或其他细节的数据库;Sourcedatabases,直接提供原始资料或具体数据的自足性数据库,包括Numericdatabases、Textual-numericdatabases、Full-textdatabases、Graphicsdatabases、Terminologicalbank等;Mixeddatabases:同时存贮多种不同类型的数据。按地理分布,分集中式/分布式数据库;按采用的数据模型,分关系型/层次型/网络型数据库;按数据存取介质,分光盘/联机/多媒体数据库等。1.2数据库的形成与发展1951年,[美]BureauoftheCensus建成第1个数值数据库;1961年,[美]PittsburghSystem的法律全文数据库是最早建成并投入使用的文献数据库;1964年,MEDLARS是世界上第1个书目数据库。20世纪70~80年代,数据库由科技领域进入商业、金融领域,并形成数据库产业;光盘/网络数据库不断涌现,数据库进入声图文一体化发展阶段。20世纪90年代以来,由于网络的发展,数据库生产呈现大型化、专业化、社会化、联机化和标准化。1.3数据库的文档、记录和索引Dbase由File构成,文档是由许多Record组成,而记录又是由许多著录项目即Field组成,一个字段下可以分为多个Subfield等。每个数据库中通常都有两种索引,即BasicIndex和AdditionalIndex。前者含有所有与主题内容相关的词,如/TI、/AB、/DE等,并用后缀标识;后者含有除基本索引字段之外的各种信息,用前缀标识AU=、LA=、PY=等表示。DIALOG数据库的记录格式与常用字段说明DIALOG数据库的记录格式AN1726598TIAlice’sadventuresinWonderlandAUCarroll,LewisPYPublicationYear:1985PUPublisher:KnopfLALanguage:EnglishBNISBN:0394805925SFSpecialFeature:IllustrationsABAlittlegirlfallsdownarabbitholeanddiscoversaworldofnonsensicalandamusingcharacters…DEDescriptors:JuvenileLiterature数据库常用字段说明字段缩写全称存取号ANAccessionNumber文献类型DTDocumentType篇名TITitle语种LALanguage作者AUAuthor刊名JNJournalName出版者PUPublisher出版年PYPublicationYear文摘ABAbstract主题词DEDescriptor国际Serial标准代号ISSNInte’lStandardSerialNumber1.4重要的检索数据库中国企业、公司及产品数据库:由原国家科委支持、联合全国近百家信息机构共同开发,始建于1988年。是DIALOG联机系统作为首选的中国经济信息数据库。Dun’sElectronicBusinessDirectory:提供全美850多万家工商企业及其专业人员的联机名录型数据库。高科技公司指南:网络版联机检索是检索终端通过通信线路直接查寻检索系统数据库的计算机检索方式。联机检索系统的构成联机检索的形成与发展著名的联机检索系统联机检索的一般程序2.1联机检索系统的构成M通讯卫星多路复用器M中央计算机外设数据库2.2联机检索的形成与发展1962年,MIT的M.M.凯塞利用IBM709计算机和IBM2741控制台进行了世界上首次联检试验。之后,DIALOG、ORBIT和MEDLINE等涌现。从20世纪70年代中期起,联机检索在世界范围内蓬勃兴起,联机检索数据库从二次文献发展到全文型、事实型和数值型;从科技扩展到经济、金融、出版等领域。进入21世纪,联机检索朝综合化与多样化、国际化和网络化、市场化和产业化等方向发展。2.3国际著名的联检系统系统名称原文名称运营公司时间联机对话型信息检索系统DIALOGsystem美洛克希德导弹与空间公司的分公司1970联机医学文献分析和检索系统MEDLINE(Medicalliteratureanalysisandretrievalon-linesystem)美国国立医学图书馆1971书目信息分时联机检索系统ORBIT(On-lineretrievalofbibliographicinformationtimeshared)美国系统发展公司1973欧洲空间组织信息检索系统ESA-IRS(Europeanspaceagency-informationretrievalservice)欧洲局信息检索服务处19732.4我国重要的联检系统20世纪70年代末,我国开始引进国外机读数据库磁带并进行联机检索试验。BeijingDocumentService是1978年由中国国防科技信息中心和北京市科协共同策划联合组建的。1981年建成我国首个联机检索系统即BDSIRS。中国知网中文科技期刊数据库万方数据资源系统Elsevier(ScienceDirect)数据库Kluwer全文期刊2.5联机检索的一般程序课题分析、接通检索系统:建立用户终端与中心计算机之间的线路连接,并键入密码来表明用户的机构标识,从而进入检索系统。选择检索系统或数据库:借助数据库手册或帮助文档进行选择;采取先国内后国外、先全文后文摘、先镜象后正式、先免费后收费等原则。输入并组配检索词:了解检索字段及组配方法。检索结果的处理与退出联检系统:包括联机或脱机打印等。3.网络信息资源及其搜索Net是利用通信线路将多台计算机连接起来,进行计算机之间的通信方式。Internet是一个全球计算机网/数据通信网/超级资源网/用户互相协作的组织。什么是网络信息检索?网络信息资源的类型搜索引擎的基本原理搜索引擎的发展状况搜索引擎的检索命令3.1什么是网络信息检索?利用Telnet、FTP、E-mail、等信息传输协议和检索工具,在Internet等网络上进行的信息存取行为。URL定位、HTTP存贮,HTML显示。与联机检索的区别:系统结构——集中式与分布式;服务模式——主仆式与C/S服务模式;信息组织方式——普通文本和超文本;检索机制——二次文献和搜索引擎。此外,在信息质量、检索空间、检索便捷性、检索费用、检索安全性、检索时效等方面都存在一定的差异。3.2NetworkInfoResources网络信息资源是以数字形式记录,以多媒体方式表达,存储在网络计算机磁介质、光介质及通信介质上的信息集合。按传输协议或IP/域名划分:Http、File、FTP、Telnet、Gopher、Wais、News、Mailto等;COM/EDU/FIRM/GOV/ORG/NET,等等。按信息加工形式划分:OPAC、网络数据库、电子出版物、OA、软件资源、动态信息等DirectoryofOpenAccessJournal中国科技论文在线3.3SearchEngine的基本原理通过网络搜索软件收集因特网上大量的Web页加以索引并提供给用户查询的专门网站。搜索引擎构成:①搜集器,负责从网络上搜集网页。基本机制是启动蜘蛛或爬虫等程序、扫描网络、查找Web页并提取数据纳入自己的数据库。②管理器,负责搜索策略的制定及管理、索引的增删改和存储组织等。③检索器,提供检索界面,根据用户查询要求,从数据库中检索出与之相关的信息并反馈给用户。④扩展服务部分。3.4搜索引擎的发展状况搜索引擎初建于1994~1995年,如WebCrawler、Lycos、Yahoo!、Excite、Digital等;经过扩容时期、质量建设时期,正走向多向发展时期。精选网站蓬勃兴起智能搜索引擎崭露头角多媒体搜索引擎靓丽登场专业搜索引擎纷纷出现搜索引擎的搜索引擎层出不穷学术搜索引擎百度文档搜索3.5搜索引擎的检索命令BasicsofSearch:包括直接输入关键词或汉语拼音;采用布尔算符连接关键词;使用规定的标点符号,如,、“”(thequoteoperator)、-(theminusoperator)、+(theplusoperator)、*、《》等。Advancedsearch:包括将搜索范围限制在某个特定的网站中;排除某个特定网站的网页;将搜索限制于某种指定的语言;查找链接到某个指定网页的所有网页;查找与指定网页相关的网页等。数学计算和单位转换、字词翻译与术语定义、新闻排行榜、学术搜索、论坛及图片等特殊功能。(1)AND、OR与NOT在Google中用空格代替and,如果想缩小搜索范围,只需输入更多的关键词就行了。在关键词之前加上“+”表示该词一定出现在检索结果中,“+”与关键字之间没有空格。如“+网络”表示搜出的文档中一定出现“网络”一词。在关键词前加上“-”,表示该关键词一定不会出现在结果当中,用于排除一些关键词以便缩小查询范围。注意减号前加上一个空格。例如,检索式“Internet-Intranet”,表示检索出所有可能包含Internet但一定不包含Intranet的文档。(2)逗号,逗号的作用类似于OR,即查询那些至少包括一个指定关键字的文档。与OR不同的是,查询所得到的文档中包含关键字越多,文档排列的位置就越是靠前。例如,查询“数字,图书馆,网络”,同时包含以上3个关键词的文档将出现在面前。(3)英文双引号””使用“”可以将检索短语作为一个完整的检索项,从而缩小检索范围,增加检索的准确性。搜索关于起源的一些历史资料。如果采用检索式,那么检索结果只有“历史”和“internet”,因为搜索引擎将把这个短语分成3部分,即“”、“的”和“历史”分别检索,并忽略最常用的词和字符,如http、.com、“的”等。这样可能影响到检索的准确性。如果要对某些词进行强制搜索,则需要在该词前加上“+”号,即+的历史internet;或者将上述字词用英文双引号引起来。(4)通配符*与英文句点.在检索词末尾或中间加上*来代替出现的字符。例如,用Compu*代表开头为Compu的任何单词;检索式*.edu.cn将会检出中国大陆的全部教育网站;检索式“以*治国”可以检索出“以德治国”、“以法治国”等。Google不支持通配符检索与通配符的作用相反,“.”是用于禁止单词的扩展。例如,关键字“gene.”,表示搜索结果中只能包含gene,而不能包含genetics、genera等词汇。(5)filetype:文件类型关键词Google支持10余种非HTML文件的搜索。包括PDF文档;MicrosoftOffice(doc、ppt、xls、rtf);ShockwaveFlash(swf);PostScript(ps);声频(MP3、RA、RM)和其它类型文档。filetype:ppt管理学;birthdayfiletype:SWF;filetype:SWFloveyou;资产负债表filetype:docORfiletype:xlsORfiletype:ppt等。(6)site:站点名称关键词Site:表示在特定的域或站点中搜索。关键词可以在site:之前或之后;关键词和site
本文标题:第7讲 联机检索与网络
链接地址:https://www.777doc.com/doc-6182816 .html