您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 人事档案/员工关系 > 第2章.信息资源管理中的内容管理 1
第2章信息资源管理中的内容管理本章基本内容2.1信息资源类型2.2信息采集2.3信息组织2.4信息检索2.5信息分析2.6信息资源开发利用2.1信息资源类型2.1.1信息资源类型概述1.按信息载体划分信息资源按载体材料和存储技术可分为(1)印刷型信息资源(2)缩微型信息资源(3)声像型信息资源(4)数字化信息资源2.1.1信息资源类型概述2.按加工深度划分零次信息:进行中的研究。一次信息:检索和利用的对象。二次信息:提供一次信息的线索。三次信息:具有综合性高、系统性好、参考价值高等特点。2.1.2文本类信息资源文本类信息资源按出版形式划分,可分为:1.图书2.期刊3.会议文献4.学位论文5.专利文献6.研究报告7.政府出版物8.标准文献9.产品资料10.文书档案2.1.3数据类信息资源1.经济数据资源(1)宏观经济统计数据(2)微观经济数据①股票市场交易数据②上市公司财务指标分析数据③上市公司治理结构研究数据④上市公司兼并收购、资产重组研究数据⑤证券投资基金研究数据⑥上市债券研究数据⑦期货市场研究数据⑧行业研究数据⑨商品市场数据2.1.3数据类信息资源(3)经济资源数据①自然资源数据②城市基础数据③企业法人数据④人口数据2.1.3数据类信息资源2.科学数据资源科学数据来源于各部门和各单位的观测、监测、调查、试验、实验以及研究分析等科技活动,涉及数值数据、空间数据、图形数据和文本数据等各种类型,分布广泛、内容复杂、形式多样、格式不一、数量庞大。(1)基础科学数据(2)基础地理数据(3)空间数据(4)地震科学数据2.1.3数据类信息资源3.科学数据共享工程中国科学技术部的科学数据共享工程是科技基础条件平台工作的重要组成部分。实施科学数据共享工程,整合并共享现有的海量数据资源,让科技界、学术界能够方便地获得所需要的数据资源,实现了数据资源的合理流动和充分利用,防止了科研活动的重复进行和科研经费的浪费,有助于持续提升国家的科技创新能力。国家气象局成为数据共享的先导和示范单位。2.1.3数据类信息资源科技部又启动了五个科学数据中心即测绘科学数据共享服务、水文水资源信息共享服务、地震科学数据共享、林业科学数据中心、农业科学数据中心和三个共享服务网(地球系统科学数据共享服务网建设与运行、现代农业技术(农村科技)信息共享服务网、可持续发展信息共享平台)。由此,包括气象科学数据共享在内九大行业的科学数据共享工程开始有条不紊地推进。2.2信息采集2.2.1信息资源的数量和来源1.图书的数量和来源据1995年《联合国统计年鉴》对120个国家图书出版情况的统计,全世界共生产图书91万多种。1997年美国出版图书8.5万~10万种,英国9.5万种,中国大陆10万种(初版新书有5万种),德国7~8万种,法国3万种,日本6万种,还有意大利、西班牙等国,各有2万~3万种。近年来上述数字变化不大。俄罗斯出书也很多,前苏联一年出书8万种。2.2.1信息资源的数量和来源我国(这里仅指大陆地区)2003年有出版社570家(包括副牌社35家),共出版图书190391种,其中新版图书110812种,重版、重印图书79579种,总印数66.7亿册。与上年相比图书品种增长11.4%,新版图书品种增长10%,重版、重印图书品种增长13.2%,总印数下降2.9%。2.2.1信息资源的数量和来源2.期刊的数量和来源由于期刊变化太快,所以,全世界的期刊有多少种?现在在版期刊有多少种?尚无人精确统计过。美国鲍克公司出版《乌利希国际期刊指南》》(Ulrich‘sInternationalPeriodicalsDirectory,NewYork::Bowker,1932-)是目前反映国际期刊出版动态及订购期刊的重要工具、其收集品种几乎囊括了世界上正在出版的全部重要西文期刊。考察几种权威的期刊工具书,目前在版期刊大约有15万种。自有期刊以来,全世界累计出版期刊在300万至500万种之间。2.2.1信息资源的数量和来源我国大陆地区2003年共出版期刊9074种,平均期印数19909万册,总印数29.47亿册。与上年相比种数增长0.5%,平均期印数下降2.44%,总印数下降0.14%。出版报纸2119种,平均期印数19072.42万份,总印数383.12亿份。与上年相比,种数下降0.84%,平均期印数增长1.88%,总印数增长4.16%。台湾地区出版的期刊有5000余种。香港定期出版的期刊有670多种,澳门有20种。2.2.1信息资源的数量和来源3.专利说明书的数量和来源世界上每年出版的专利说明书约为100-110万件。根据中国国家知识产权局的统计数据,2003年我国专利申请总量为30.9万件,授权量18.2万件,分别比上年增长了22%和38%。英国国家图书馆2004年累计专利说明书5348万件专利说明书,是世界上最大的专利库藏。截止2004年底,我国国家知识产权局专利局专利文献馆拥有29个国家3个国际组织的专利说明书,总量为4000多万件;还可提供88个国家及国际组织专利信息检索工具。2.2.1信息资源的数量和来源4.技术标准的数量和来源技术标准是一种增长比较缓慢的文献。目前,国际标准化组织(ISO)和国际电工委员会(IEC)颁布的现行有效的国际标准有16745项。约有100多个国家和地区设有全国性标准化组织。其中有90多个国家和地区制订了国家标准。据统计,截止1991年年底,世界上各类标准文献共计120多万件。在我国,据统计,到2001年底,已颁布国家标准19744项,专业(部)标准31900项,地方标准11660项,企业标准871项。国家标准40%采用国际标准和国外先进标准。2.2.1信息资源的数量和来源5.其他文献的数量和来源据《科技会议录索引》(IndextoScientific&TechnicalProceedings,简称ISTP)报道,全世界每年要召开上万个科技会议。它每年报道大约4000多个会议的会议录、收录会议论文约16万篇。《世界会议》(WorldMeetings,简称WM)是由美国WorldMeetingsInformationCenterInc.编辑,MacMilanPublishingCompany出版,专门报导未来两年内将要召开的国际学术会议信息。2.2.1信息资源的数量和来源研究报告的数量随着科技和经济的发展而迅速增长,1945~1950年间年全世界的产量在7500~100000件之间,20世纪70年代增至每年50万件,80年代每年略有增加。在我国,中国科学技术情报研究所是收藏国外学位论文较多的单位。北京图书馆收藏了1983年由美国友好书刊基金会赠送的美国1938-1977年博士论文的缩微胶卷。1986年,清华大学订购了美国部分著名大学,如麻省理工学院(1983年以来的)、加利福尼亚大学伯克利分校、斯坦福大学(1984年以来某些系的)博士论文的缩微平片。《中国学位论文通报》是我国自然科学类学位论文的权威性检索工具,1985年创刊。2.2.1信息资源的数量和来源6.数据资源的数量和来源数据资源数量非常庞大,而且增长迅猛,所以很难统计。据查,世界性的,国家或地区性的,学科或专业性的数据量统计,都很难获得。据报道,截止2004年10月底,我国大陆科学数据库数据资源建设已建成专业数据库388个,总数据量达13TB。目前,科学数据库分布在各地的网站42个,上网专业库322个,网上可查询数据量达7.7TB,通过Internet提供共享服务。提前一年超额完成了“十五”期间数据资源达到10TB的建设任务。经济和社会生活领域产生的数据量更加庞大。2.2.1信息资源的数量和来源科学数据的来源一般是科研机构、科学数据中心、以网络或其他方式提供的科学数据库等。经济和社会统计数据的主要来源有:行业协会、公司、银行、交易所、经纪人、政府部门和国际组织、独立的调查机构、市场研究机构、数据汇编机构、出版商、媒体、非营利性组织、大学、研究中心等以及它们的网站。行业和一般的商业数据主要来自政府统计部门、国际统计机构、政府调查资料、政府行政管理档案、市场调研报告和行业报告、经济分析师报告、银行报告、新闻报道、贸易类期刊。经济数据和财政数据主要来自银行、信贷机构、保险公司、基金管理公司、政府经济普查机构、媒体、面谈调查等渠道。2.2.2信息采集原则信息采集是指通过各种方式获取所需要的信息,是信息资源有效管理和利用的第一步,也是关键的一步。为了保证信息采集的质量,应坚持以下原则:1.系统性原则2.针对性原则3.及时性原则4.可靠性原则5.方便、经济的原则6.计划性原则7.预见性原则2.2.3信息采集策略1.定向采集与定题采集2.单向采集与多向采集3.主动采集与跟踪采集4.建立信息网络5.利用互联网进行信息采集6.严格管理与激励措施相结合2.2.4采集方式1.文献型信息资源的采集购买、交换、接受、征集、申请、复制、网络搜索2.实物型信息资源的采集3.鲜活型信息资源的采集交谈、采访、社会调查等4.数据的采集观察、实验、检测、考察、调查、统计、检索、普查和科学研究等2.2.5新的采集技术1.全自动电话访谈2.交互式计算机辅助电话访谈3.电脑柜调研4.网络调研系统2.3信息组织2.3.1信息表示概述信息表示:1.信息表示的来源信息从创建到传播利用的每一个阶段都可能产生不同形式的信息表示。2.3.2信息表示概述2.信息表示的生成方法派生法,是指信息表示直接来自对象信息集合自身,利用某些识别和分析技术,从对象信息集合中提取出可用于信息组织和检索的语词符号或其他特征标识。传统的派生法又称为关键词索引法、自动抽词标引或派生式标引。不同的对象信息有不同的特征,所以其特征信息的识别和提取方法也不同。指派法,是指信息表示来自对象信息的外部,由信息加工处理者在对信息内容进行分析的基础上;考虑其潜在用户的知识结构,参考社会的公共知识结构,确定要揭示的信息内容属性及表示方式,直至把标识(如标引词、分类号)赋予对象信息的过程。2.3.2信息表示语言1.置标语言置标语言(MarkupLanguage)由一些代码(codes)或控制标记(tags)组成,这些代码或控制标记本身若单独存在是无意义的,它们必须结合文件信息后才能形成一份有用的电子文件,而所谓有用的电子文件是针对应用软件来说的,即应用软件能够解读电子文件中的置标语言,并通过置标语言的意义对电子文件进行特定的处理。置标语言不同于一般的控制流程序设计语言,基本上可以被视为是一种数据流的文档结构描述语言。在计算机处理过程中,置标语言的标记既可以作为数据,也可以作为控制语句来使用。置标语言的产生有多种因素:信息交换(InformationExchange)与信息再利用(InformationReuse)问题。2.3.2信息表示语言置标就是给文档中某些具有特殊含义的部分加上标记的过程,置标的符号就是该过程的具体实现。在20世纪80年代早期,IBM设计了一种文档系统,通过在文档中附加一些标签,从而可以标识文档中的各种元素。IBM把这样的标记语言称为通用置标语言(GeneralizedmarkupLanguage,GML)。1986年国际标准化组织认为IBM提出的概念很好,并发布了为生成标准化文档而定义的标识语言标准,称为标准通用置标语言(StandardGeneralizedMarkupLanguage,SGML)。SGML:SGML是ISO在1986年所制定的描述文档资料的结构与内容、实现文档交换和共享的国际标准。它是数据描述、数据模型化和数据交换的标准,同时又是一种元语言,元语言是一套可以用来定义其它更专门性的标记语言的通用规则。普通的SGML文档一般由三部分组成:SGML声明、文档类型定义及SGML文档实例。SGML声明定义文档使用的语言集、参考语法规则、SGML可选特性等;文档类型定义(DTD)描述文档的结构模板、
本文标题:第2章.信息资源管理中的内容管理 1
链接地址:https://www.777doc.com/doc-4279208 .html