您好,欢迎访问三七文档
第一章概述1.什么是信息熵informationentropy信息中排除了冗余后的平均信息量称为“信息熵”。信息熵是信息论中用于度量信息量的一个概念。一个系统越是有序,信息熵就越低;反之,一个系统越是混乱,信息熵就越高。所以,信息熵也可以说是系统有序化程度的一个度量。2.什么是互信息MutualInformation互信息是信息论里一种有用的信息量,它是指两个事件集合之间的相关性。它可以看成是一个随机变量中包含的另一个随机变量的信息量。两个事件X和Y的互信息定义为:I(X,Y)=H(X)+H(Y)-H(X,Y),其中H(X,Y)为联合熵。3.信息化指数InformatizationDevelopmentIndex的作用和内容作用:反映社会经济信息化程度。内容:信息化指数包含一套指标体系,由信息量(Q)、信息装备率(E)、通信主体水平(P)、信息系数(U)四个主要因素构成的。第二章信息资源管理的内容1.图书馆和档案馆的区别libraryarchives图书馆是知识和文献收藏、整理以及提供利用的社会信息交流中心,主要的是对文献的收藏以及利用。档案馆是收集、保管档案的机构,负责接收、征集、管理档案和开展档案利用等,档案馆是集中保管党和国家重要档案的基地,是社会各个方面利用档案信息资源的中心,档案馆工作是我国档案事业的主体。2.信息资源管理的资产管理角度的重点是什么Assetmanagement信息资产管理更关注对企业中的各项信息资产,包括信息系统、数据文档、通信协议等进行识别和集中管理,进而实施有效的ISMI(信息安全管理体系)或SOC(安全运营中心)以保证信息系统所承载的企业业务的持续有效发展。3.信息资源管理的目标是什么target信息资源管理的目标一般可以分为总目标和分目标两个方面。总目标:保证信息资源的开发利用在有领导、有组织的统一规划和管理下,协调一致、有条不紊地进行,使各类信息资源以更高的效率、效能和更低的成本在国家社会进步、经济发展和人民物质文化生活水平的提高中充分发挥应有的作用。分目标:(1)信息资源开发分目标。主要是根据社会发展的需要来合理组织、规划信息资源的开发,确保相关潜在信息资源能及时、经济地转化为现实的信息资源;(2)信息资源利用分目标。主要是按照社会化、专业化和产业化的原则合理组织信息资源的分配,确保信息资源能得到充分有效的利用;(3)信息资源管理机制分目标。主要是遵循客观经济规律、建立和健全科学、合理的信息资源管理机制,完善信息资源开发利用的保障体系。4.信息资源管理的三个层次是什么threelayers宏观管理、中观管理和微观管理。宏观和中观是微观的前提,微观是宏观和中观的基础。5.利用经济杠杆调节信息资源管理是什么意思economiclever信息资源管理的经济手段是指运用各种经济杠杆的利益诱导作用,促使信息资源开发利用机构从经济利益上关心自己的活动,是一种间接组织和协调信息资源开发利用活动的手段。第三章信息资源的分布1.马太效应对信息资源的影响是什么Mattheweffect马太效应:在社会信息流的产生、传递和利用过程中,信息常常表现出明显的核心趋势和集中取向,这就是信息资源产生和分布中的马太效应。由马太效应引起的信息富集分布表现为核心趋势和集中取向。核心趋势是信息产生主题(行为者)的主动期望与采取实际步骤的结果。集中取向则不同,这种富集是社会选择和影响的结果。两者的效果是一致的,仅仅是累积的程度不一样,前者是主动的选择,后者是被动的接受,前者称为自增生过程,后者倾向大变量分布过程。优点:在实际的信息管理工作中,他可以帮助我们突出重点、摒弃平均,为信息源的选择、获取、评价提供依据,为降低信息管理的成本、提高信息利用率提供指导和方法。在理论上,马太效应描述的优势可以帮助人们认识信息集中与分散的特征、趋势和规律,发现信息管理学的基础性定律。缺点:马太效应描述信息资源的优势和劣势的过度积累,容易使信息工作者按简单的优劣进行信息的选择、评价、传播和利用,走入极端,使信息工作者因循守旧、不思进取、不求变革创新,按经验和简单的规则从事复杂多变的信息管理工作。2.普赖斯曲线的内容Place’scurve(公式)如果以文献量为纵轴,以历史年代为横轴,把不同年代的文献量在坐标图上逐点描述出来,然后以一光滑曲线链接各点,则可十分近似地表证文献量随时间增长的规律,这就是著名的普莱斯曲线。3.信息的空间传播规律lawofinformationpropagationinspace包括信息扩张(与分布)的多项对称性和信息传递的密度递减法则。(1)信息扩散的多想对称性:指信息化在传递或扩散的过程中,如果信息源所处的哇为介质(包括自然介质、社会介质)是同质均匀分布的话,则信息传递则呈一种多项对称结构。分为四种形式——传递速度对称,传递内容对称,传递空间对称,传递信息强度对称。(2)信息传递的密度递减法则:信息传递是在一定信息时空中完成的,由于传递过程中的种种因素的介入,任何信息流都要发生衰减,信息流过程越长,信息衰减越严重。由于信息传递设计时间和空间两方面,因此,衰减也就发生在时间和空间两方面。4.布拉德福定律的内容Bradford’sLaw如果将科学期刊按其期刊某个学科主题的论文数量,以递减顺序排列起来,就可以在所有这些期刊中区分出载文率最高的核心部分和包含着与核心部分同等数量论文的随后a区,这时核心区和后几各区中所含的期刊数成1:a:a²的关系(a1)。这就是布拉德福定律的区域表示形式。是描述文献分散规律的经验定律。5.洛特卡定律的内容Lotka'slaw它描述的是科学工作者人数与其所著论文之间的关系:所有写1篇论文的作者的比例刚刚超过60%,写2篇论文的作者大约是写1篇论文作者数的1/4,写3篇论文的作者数大约是写1篇论文作者数的1/9,写n篇论文的作者数大约是写1篇论文作者数的1/n²。该定律被认为是第一次揭示了作者频率与文献数量之间的关系,描述科学生产率的频率分布规律。6.普赖斯定律的内容Pricelaw(公式)在某一特定领域中,全部论文的半数系由该领域中全部数量的平方根的那些人撰写的,“那些人”无疑使核心或高产作者。第四章信息资源采集1.信息资源采集的流程collection信息资源采集的一般过程可以分为需求分析、信息源选择、信息资源采集策略确定、采集活动实施、采集效果评价和解释五个步骤。2.什么是采全率采准率Overall-rateofacquisition;Accuracyrateofacquisition采全率用来衡量切题信息搜集的完整程度,指某一信息系统(信息库)所含的全部切题信息(对该系统全体用户而言)在当时系统内外所有切题信息中所占的比例,可以用公式表示为:P=r/R。式中,P表示采全率,r表示该信息系统中切题的信息,R表示当时系统内外全部切题的信息。采准率用来衡量信息搜集的针对性,指某一信息系统(信息库)所含的全部切题信息(对该系统全体用户而言)在当时该系统所有信息中所占的比例,可以用公式表示为E=r/Q。式中,E表示采准率,r表示该系统中切题的信息,Q表示系统内所有的信息。3.信息采集的效率指标EfficiencyIndex有哪些采全率、采准率、及时率、费用率、劳动耗费率及时率用来衡量信息搜集的速度,即在最短的时间内完成信息搜集过程的能力。费用率用来衡量信息资源采集的资金效率,即用于信息库中单元信息的费用的最低能力。劳动耗费率指信息系统搜集到的单位信息所耗费的最低劳动量。4.什么是结构化的访谈Structuredinterviews结构式访谈又名标准化访谈,结构式访谈是一种定量研究方法。这种访谈的访问物件必须按照统一的标准和方法选取,一般采用机率抽样。访问的过程也是高度标准化的,即对所有被访问者提出的问题、提问的次序和方式、以及对访问者回答的记录方式等是完全统一的。5.什么是公共联机书目查询系统OPACOPAC原意是“开放的公共查询目录”,随着技术的发展而演化为“联机公共书目查询”,其含义是传统读者目录查询的自动化,是一种通过网络查询馆藏信息资源的联机检索系统,用户可以不受地点空间的限制,查询各图书的OPAC资源。6.什么是push技术Push技术作为Internet上的一项新兴技术,提出了一种新的服务模型,由服务器主动的将信息发往客户端的技术,即内容服务商按照用户选定的主题内容,周期性地为用户提供相关信息。7.什么是文本挖掘TextMining文本挖掘技术是数据挖掘领域的一个分支,是指从大量文本数据中发现和提取隐含模式和知识,它涵盖了文本分析、模式识别、统计学、数据可视化、数据库技术、机器学习、自然语言处理和人工智能等多领域技术。8.分类和聚类的差别classificationclustering分类是指从待分类对象中提取特征,通过与实现定义好的各种类别具有的共同特征进行分析比较,再将分类对象划分为特征最接近的一类并赋予相应的分类标识。聚类是指从待分类对象中提取特征,再将提取出来的全部特征进行比较,根据一定的规则将具有相同或相近特征的对象定义为一类。9.什么是自动文摘Automaticabstracting文摘是以简短的形式,准确表达原始文献的主要内容。自动文摘也称为自动摘要,就是利用计算机自动地从原始与文献中提取文摘。第五章信息资源组织和存储1.常用的著录标准有哪几个BiliographicDescription文献著录标准化是指在国家或国际范围内,对文献著录的原则、内容、格式等作出具有一定约束力的规范。国际:(1)ISBDInternationalStandradBiliographicDescription《国际标准书目著录》(2)AACRZAnqlo-AmericanCatacogingRules:Z《英美编目调理(第2版)》国内:(3)《文献著录总则》2.什么是元数据metadata机读目录MARCIFLA将其定义为“描述资料的资料”,可用来协助对网络电子资源的辩误、描述、指示其位置的任何资料。MARC是机器可读目录的简称,是以编码形式和特定结构记录在计算机存储载体上,由计算机程序自动控制、处理与编辑输出的目录。3.什么是复合主题Compoundsubject复合主题指由两个或多个概念因素结合构成的主题,其概念之间的类型有并列概念构成的复合主题,事物与方面构成的复合主题,事物与部分概念构成的复合主题。4.分类标引classifiedindexing主题标引subjectindexing分类标引,又称文献分类或信息分类,是依据特定的分类语言,赋予文献分类标识的过程。通过分类标引赋予文献分类标识(分类号),可以将大量的文献分门别类,纳入特定的分类体系,实现文献的分类组织。主题标引,是依据特定的主题语言,赋予文献主题标识的过程。主题标引所依据的主题语言可以是标题语言、叙词语言和关键词语言等。因此,主题标引赋予文献的主题标识可能是标题、叙词或叙词标目、关键词等。不过,目前我国主要采取的是叙词语言。因此,主题标引主要是叙词标引。5.引文索引CITATIONINDEX引文索引是近30年来出现的一种新型的索引形式。其特点是把一系列具有引用与被引用关系的科学文献以多向线性的方式联系起来,提供一个以引证关系为依据来检索文献的新途径。引文索引的组织形式是按照被引论文的作者排列,在被引论文之下,再按年代列举引用该文献的全部论文。利用引文索引可以追溯某一观点、某一发现的产生与发展过程,一级这些观点和发现是否被人应用过、修改过,是否有所发展等。文献著者可以通过此索引了解自己成果的影响和作用。因此,引文索引的主要职能是,回答某作者的论文曾经被那些人的文章所引证,这些文章何时发表在何种刊物上。
本文标题:信息资源管理复习
链接地址:https://www.777doc.com/doc-2693215 .html