您好,欢迎访问三七文档
信息管理概论王爱Wangai_001@163.com——第三章信息分布23信息分布3.1信息产生与分布中的马太效应3.2信息生产者的分布规律3.3信息内容的离散分布规律3.4文献信息增长规律3.5网络应用:网络信息资源的分布规律33.1信息产生与分布中的马太效应3.1.1马太效应的表现和作用形式3.1.2马太效应的负面影响43.1.1马太效应的表现和作用形式核心趋势高产作者群体的形成期刊信息密度增大高频词汇的确立集中取向一篇论文多次被引用一个网站被众多用户点击53.1.2马太效应的负面影响信息分布的富集现象:突出重点、摒弃平均,为信息源的选择、获取、评价和利用提供依据,降低信息管理成本,提高信息利用效益。核心信息源:1、忽略分布在其他信息源中有价值的信息2、马太效应青睐名人、拒绝新人的习惯势力限制了新思想、新知识和新信息的产生及传播。63.2信息生产者的分布规律3.2.1洛特卡定律1926年,统计学家洛特卡经过大量统计和研究,在美国著名的学术刊物《华盛顿科学院学报》上发表了一篇题名为“科学生产率的频率分布”的论文,之灾通过对发表论著的统计来探明科技工作者的生产能力及对科技进步和社会发展所作的贡献。73.2.1洛特卡定律(图形描述)83.2.1洛特卡定律(数学描述)93.2.1洛特卡定律(数学描述)103.2.1洛特卡定律(数学描述)113.2.2普莱斯定律123.3信息内容的离散分布规律3.3.1布拉德福定律3.3.2齐夫定律133.3.1布拉德福定律的提出一.产生背景①“文献分散”是普遍存在的客观现象。某一学科的“相关文献”往往分散在各种其他学科的期刊上。②科学统一性原则。每一个科学学科都或多或少,或远或近地与其他任何一个学科相关联。因此,属于某学科的文献,不仅仅会出现在这个学科的专业期刊上,而且也时时可能出现在其他学科的期刊上。③文摘的“缺陷”。科学文摘的“遗漏和重复摘录”的缺陷,促使布拉德福对文献流分布的内部机制进行全面、深入的研究。143.3.1布拉德福定律的提出(II)二.提出过程:1934年,[英]S.C.Bradford,首次提出了定量描述文献分散规律的经验定律。假设:任何一学科的绝大部分专业文献都集中于少数的相应专业期刊内,但是同时也散布于其它的相关期刊中。其散布的态势则与该学科研究范围的大小有关。E.L.Jones编辑了《应用地球物理现刊目录》和《润滑季刊目录》,并以此为样本进行统计分析。Bradford在此基础上,进行了更加细致深入的研究,证实了自己当初的假设,并提出了文献分散的定律。153.3.1布拉德福定律的原始形式(I)1.区域表示法(ZonalExpression)——又称为“文字表示法”(VerbalExpression)假设一定时间内(通常为一年)共有N种期刊刊载了某学科的论文(简称为“相关论文”)K篇,将这N种期刊按照所载“相关论文”的数量降序排列,然后,将该序列划分为三个区,使得每个区所包含的”相关论文“的数量相等(即“K/3篇”),则各区的期刊数量满足下列关系:n1:n2:n3=1:a:a2(a1)n1,n2,n3分别为“各个区的期刊数量”,显然n1+n2+n3=N;a为“布拉德福常数”(或称“比例系数”)。上述三个区分别称为:“核心区、相关区、外围区”163.3.1布拉德福定律的原始形式(II)分区期刊载文数量(篇/年)应用地球物理学润滑期刊数量论文数量期刊数量论文数量核心区x>494298110相关区4≥x>15949929130外围区1≥x258404127152实例:布拉德福的统计数据(1934年)结论:n1:n2:n3≈1:5:521.区域表示法(ZonalExpression)——又称为“文字表示法”(VerbalExpression)173.3.1布拉德福定律的原始形式(III)2.图像表示法(GraphicalExpression)——又称为“经验表示法”(EmpiricalExpression)假设一定时间内(通常为一年)共有N种期刊刊载了某学科的论文(简称为“相关论文”)K篇,将这N种期刊按照所载“相关论文”的数量降序排列,然后,以期刊累积数量的对数(lgn)为横坐标,以相应的“相关论文”累积数量(R(n))为纵坐标作图如下:AlgnR(n)CB0核心区相关区外围区(经典)布拉德福分散曲线183.3.1布拉德福定律的原始形式(IV)推论:假设一定时间内(通常为一年)共有N种期刊刊载了某学科的论文(简称为“相关论文”)K篇,将这N种期刊按照所载“相关论文”的数量降序排列,然后,将该序列划分为三个区,使得每个区所包含的”相关论文“的数量相等(即“K/3篇”),则前面各区的期刊累积数量满足下列关系:α:β:γ=1:b:b2(b1)α,β,γ分别为“前面各区的期刊累积数量”,显然γ=N;b为“分散系数”(或称“维氏系数”)。2.图像表示法(GraphicalExpression)——又称为“经验表示法”(EmpiricalExpression)19两种表示法是等价的吗?比较:假设一定时间内(通常为一年)共有N种期刊刊载了某学科的论文(简称为“相关论文”)K篇,将这N种期刊按照所载“相关论文”的数量降序排列,然后,将该序列划分为三个区,使得每个区所包含的”相关论文“的数量相等(即“K/3篇”),则:区域法:各区的期刊数量满足等比关系;n1:n2:n3=1:a:a2(a1)图像法:前面各区的期刊累积数量满足等比关系。α:β:γ=1:b:b2(b1)其中,α=n1;β=n1+n2;γ=n1+n2+n3结论:“区域表示法”和“图像表示法”之间,存在着无法统一的矛盾。3.3.1布拉德福定律的原始形式(V)20两种表示法哪个更准确?“区域派”F.F.Leimkuhler、W.Goffman、……“图像派”B.C.Brookes、M.G.Kendall、……3.3.1布拉德福定律的原始形式(VI)21文献为什么“离散”?科学统一性原则:每一个科学学科都或多或少,或远或近地与其他任何一个学科相关联。因此,属于某学科的文献,不仅仅会出现在这个学科的专业期刊上,而且也时时可能出现在其他学科的期刊上。文献为什么“集中”?成功产生成功的原则(thesuccess-breeds-successprinciple):一种期刊的文献量越大、质量越高的期刊,作者就越愿意将自己的文章刊登在这些期刊上,形成了一种“堆加效应”。“文献分布的集中与离散规律”3.3.1布拉德福定律的理论解释223.3.1布拉德福定律的应用(I)意义:为文献情报用户选择情报源,合理使用资金提供定量依据,以利于作出科学决策。233.3.1布拉德福定律的应用(II)⑦用于文献检索:估计全检某专业论文和相应期刊总数;根据检索要求,估计被检期刊的最小数量;计算检索效率和评价检索工具的完整性。主要应用:①确定核心期刊;②指导读者利用期刊(确定核心期刊);③指导期刊订购工作(确定核心期刊);④考察专著的分布(确定核心出版社);⑤动态馆藏的维护(确定核心期刊和确定核心读者);⑥学科幅度的比较和学科的重叠程度(比较核心区);24实例:采用“布拉德福定律方法”测定“核心期刊”3.3.1布拉德福定律的应用(III)①根据所要测定的学科(或专业)来选择合适的检索工具。②确定适当的时间范围。③利用上述工具统计该时间范围内的论文数和期刊数。④根据期刊的“载文量”按照“降序”进行排队,制定数据表格。⑤分析数据,确定该学科(或专业)的核心期刊。a)区域分析法(ZoneAnalysis)b)图像分析法(GraphicalAnalysis)25区域分析法:根据具体情况将这些期刊分成若干个区(一般为3个区),使每个区的文献数量大致相等。这时,第一区的期刊即为该学科(或专业)的核心期刊。分区期刊载文数量(篇/年)应用地球物理学润滑期刊数量论文数量期刊数量论文数量核心区x>494298110相关区4≥x>15949929130外围区1≥x258404127152实例:布拉德福的统计数据(1934年)3.3.1布拉德福定律的应用(IV)实例:采用“布拉德福定律方法”测定“核心期刊”263.3.1布拉德福定律(图形描述)273.3.1布拉德福定律布拉德福定律有两个基本要点:一是频次等级排序,形成主体来源(期刊)的有序目录;二是确定相关论文在主体来源中的分布规律。具体方法则包括区域分析和图形描述,虽然两者数值并不相等,但它所揭示的都是论文在期刊中的分散规律。布拉德福定律主要揭示的是宏观层次的信息(文献)离散分布,而对于微观层次的信息(内容单元)分布的研究则基本是空白。283.3.2齐夫定律293.3.2齐夫定律303.3.2齐夫定律313.3.2齐夫定律323.4信息对时间的分布规律3.4.1指数增长律3.4.2逐渐过时律333.4.1文献信息增长的原因及其影响(I)科学文献的增长(GrowthofScientificliterature):随着时间的推延文献数量的增长情况。实例:美国《化学文摘》的增长情况:第一个100万篇32年(1907—1938),第二个100万篇18年,第三个100万篇8年,第四个100万篇4.75年,第五个100万篇3.3年……34根本原因:科学技术的发展所带来的科学知识量的增长。第一次翻番从公元初一1750年历时1750年第二次翻番从1750年一1900年历时150年第三次翻番从1900年一1950年历时50年第四次翻番从1950年一1960年历时10年人类科学知识量翻番情况3.4.1文献信息增长的原因及其影响(II)35直接原因:①科研经费和科技人员数量的激增。年代科学家人数1800年1,000名1850年10,000名1900年100,000名1950年1,000,000名1970年3,200,000名2000年10,000,000名世界科技人员增长情况年份192019301940195019551960196519701975费用(百万美元)801603772,8706,27013,73020,43026,56635,600占国民生产总值比例(%)0.10.20.41.01.62.73.02.7-美国科研经费增长情况3.5.1文献信息增长的原因及其影响(III)36直接原因:①科研经费和科技人员数量的激增。②专业范围的扩大和细分化。③学科之间相互渗透。④科学技术的国际化。⑤研究的合作化和集体化。⑥研究的周期缩短、产生成果和转化的速度加快。⑦通讯、出版技术的改进和情报工作的加强。根本原因:科学技术的发展所带来的科学知识量的增长。3.4.1文献信息增长的原因及其影响(IV)37负面影响:影响情报工作的效率和情报事业的发展。造成很多科研工作的重复和浪费。在理论上,加强对文献增长规律的研究。对策:在技术手段上,采用计算机等现代化的先进技术和设备来处理和利用文献情报。3.5.1文献信息增长的原因及其影响(V)383.4.2文献信息的指数增长模型(I)Ryder的发现1944年,[美]FremontRyder,对美国有代表性的大学图书馆的藏书增长率进行了研究。结论:美国主要大学图书馆的藏书量,平均每16年递增一倍。数学规律?393.5.2文献信息的指数增长模型(II)德里克·普赖斯(DerekPrice)“似乎没有理由怀疑任何正常的、日益增长的科学领域内的文献是按指数增加的,每隔大约10年到15年时间增加一倍”;“每年增长约5-7%”。(《巴比伦以来的科学》,1961)普赖斯曲线100200300400tF(t)403.4.2文献信息的指数增长模型(III)Price的指数增长模型F(t)=aebt(a>0,b>0)F(t):时刻t的文献累积量;t:时间(一般以年为单位);a:条件常数,即统计的初始时刻(t=0)的文献量;e:自然对数的底(e=2.71
本文标题:第三章信息分布
链接地址:https://www.777doc.com/doc-4397282 .html