您好,欢迎访问三七文档
信息计量学总复习文献计量学(bibliometrics)1969年,美国目录学家,AlanPritchard:将数学和统计学的方法运用于图书及其他交流介质的研究的一门学科。科学计量学(scientometrics)1968年,前苏联学者提出:关于科学技术进步的计量研究情报计量学(informetrics)1979年,德国,ottonacke图书馆学情报科学科学学科学计量学情报计量学文献计量学图书馆学情报科学科学学科学计量学情报计量学文献计量学目前发展的趋势从文献计量向情报计量发展--情报学定量化研究:文献计量学及其应用(46.4%);情报检索;情报学理论研究;情报经济学与情报成果评价.--计量单元:册\本为单位的文献单元-内部知识单元计算机辅助的计量研究和应用--大量\规范数据源--数据处理和分析工具网络信息计量学研究第一部分文献计量学基本规律一.文献增长的基本估计增长年率6%~8%CA发表100万篇文摘所用年数1.32年(1907~1938)2.18年3.8年4.4.75年5.3.3年6.2年第一节文献信息增长规律二、文献激增带来的影响图书馆:经费紧张、人力缺少、馆藏空间不足科学管理科技人员:阅读本专业文献的5%,情报损失量20%-80%有效利用科技情报科研工作;重复、浪费评价科研绩效三、文献信息的指数增长规律信息量度指标和方法1绝对值指标:数量/累积数量(增长规律研究)2相对值指标:比例/累积比例普赖斯,1949,哲学汇刊,tF(t)科学文献的指数增长曲线F(t)=aebt(a0,b0)a:统计初始时刻的文献量b:持续增长率评价文献增长速度的定量标准:文献量增加一倍所需的时间(倍增期)不同学科的文献增长速度是不同的化学化工:8-9年原子能与环境科学:2-3年从统计实例来看,科学文献指数增长率正确反映了文献的实际增长情况.1952-1982世界图书,倍增率20年1907-1977世界化学,倍增率10年局限性--科学文献并不总是按指数函数增长,还与学科和统计时间有关。学科范围越广泛,符合指数规律的时间越长;开始统计的时间越晚,增长率值越大。--指数增长曲线已有平缓趋势--指数规律不能预测文献的未来增长趋势反映历史,不能预测未来对科学文献增长的机理研究不够没有考虑停刊因素没有考虑老化因素四、文献信息的逻辑增长规律AF(t)tK/2增长率变小,延缓增长,并趋于一个极限值弗来明等,1965-1975年间煤的气化法肥大细胞研究学科诞生和发展期:指数学科相对成熟期或突破的前期;逻辑描述过去,预测未来,增长规律实际上是会受到许多因素影响和制约的,真正的预测需结合系统论。1.逻辑增长模型原指生物学中的“生长曲线”,描述生物界一类典型的繁殖过程,即开始阶段按指数规律增长得很快,但随着时间的推移,繁殖速度减慢,并逐渐趋于不增。一般称为饱和的指数增长曲线。2.逻辑曲线的机理分析逻辑模型与指数模型的关系dN/dt=bN(k–N)与dN/dt=bN普赖斯指出:科学发展的所有明显的指数型终将成为逻辑型模型。指数型是逻辑型的发展的初始阶段,而逻辑型是指数型最终的发展趋势。逻辑型曲线的局限性是导致科学发展的极限论,增长率为零。3.普赖斯—纳里莫夫循环曲线4.科学知识增长规律总结科学知识按指数增长的规律恩格斯指出:科学按加速度发展,即按指数函数增长规律性发展。(图书文献的增长/科学知识的增长/科学指标的翻番时间)智力潜热现象,科学技术发展的波浪式前进,永无止境。科技文献的阶跃型增长曲线五、文献信息增长的其他数学模型线性增长模型分级滑动指数模型超越函数模型舍-布增长模型六、文献信息增长机理的分析科研经费和科技人员的激增使文献量增长普赖斯n2nn的平方根专业范围的扩大化和细分化学科之间相互渗透科学技术的国际化研究的合作化和集体化研究周期缩短,产生成果和转化速度加快通讯、出版技术的改进以及情报工作的加强(数据库)七、文献信息增长规律的应用在科学学和科技史研究中的应用模拟科学技术发展过程,探讨规律,普赖斯,在文献指数增长规律基础上得出科学技术呈指数规律增长的结论.在文献信息管理中的应用图书馆经费的预算/资料收集的原则/馆藏增加的策略/存储空间扩大在情报研究中的应用专利文献是科技发展的最敏感指标为技术引进提供决策依据半导体扩散技术专利数19501954日本1962196619701958世界其他国家第二节科技文献的老化规律一、文献老化现象1.科技文献老化的概念科技文献随时间的推移,使用频次逐渐减少的现象美国,Gosnell,1944《大学图书馆藏书的老化率》:在知识的累积过程中,一些知识及其载体会逐渐失去其原有价值。普赖斯:被引用数据,一篇文献平均寿命十年,对老化进行了定量研究2.情报老化与文献老化的区别情报老化:情报的有效价值随时间流逝而减少的现象,情报可能在相当长的时间不会老化,而文献老化是针对用户而言,因用户的使用习惯而造成。3.影响文献老化的因素文献内容的变化:过时、错误、被普及、被替代文献增长的影响:一些文献被引用日益减少并非完全由于文献老化,而是由于文献的增长。学科性质差异:基础性学科、以客观事实和经验数据为主的学科(地质、植物)、应用性学科学科发展阶段:初始和发展阶段、成熟阶段用户需求:科技期刊、学位论文、科技报告、科技图书二.文献老化过程的定量研究1.文献老化过程的定量研究方法文献流通统计数据分析法kent,6所科学图书馆,1968-1975,7年1)文献借阅次数统计2)文献流通量统计(如复印量)引文分析法(最多、最有效的方法)1)引用文献分析法(同时法)2)被引文献分析法(历时法)引文分析法:给定时间间隔,专业文献,参考文献出版年代的相对数量分布1988年,生物医学老化规律引文量1988198019701960195019401930被引文献分析法:某专业一定量文献,引用这些文献的文献量按时间的分布研究。国际物理期刊老化研究1960年,40种刊,2500篇文献,SCI引文量19601965197019751980198519902.模拟老化过程的数学模型1)负指数模型布鲁克斯的基本假设:科技文献的被引用数量随时间推移的衰减过程近似服从负指数模型,当文献达到被引用峰值后,便开始经历文献老化的衰减过程,于是就可以得到拟合度很高的负指数曲线负指数模型的形式C(t)=Coe-bt=Ke-bt观察SCI的引用数据表概率密度函数f(x)=be-bx累计分布函数F(t)=1--e-bt老化系数a=e-b2)伯顿-开普勒公式y=1--(a/ex+b/e2x)(a+b=1)3)莫德列夫修正式y=1--(a/ex-0.1+b/e2x-0.2)(a+b=1)被引文献累积百分比出版年限三.老化速度的测度指标1.半衰期和中值引文年龄贝尔纳定义适用于历时法:所发表的文献有一半不被引用的时间;评价专业、期刊、某篇文献的老化伯顿—开普勒定义适用于同时法(中值引文年龄):参考文献中的一半所在发表时间段,评价某一学科或专业的文献老化趋势2008年,200篇,3000篇参考文献,1985-2005年,其中1500篇是1985-1995年,半衰期为10年SCI中的引用半衰期和被引半衰期定义2.计算方法作图法、公式法3.普赖斯指数定义的表述P=出版年限不超过5年的被引文献数量*100%被引文献总数量可以用于评价期刊,研究所的论文普赖斯指数与中值引文年龄的区别老化速度快,中值引文年龄短,P大,4.老化系数a=e-b测度文献老化速率的重要参数其值大则老化慢,其值小则老化快四.文献老化规律的应用在文献管理中的应用1指导剔旧工作,优化馆藏2提高文献服务的质量和效率在科学学和科技史研究中的应用根据文献老化曲线和量度数据,可以判断学科的性质以及所处的发展阶段,对学科的发展方向和发展趋势作预测。第二部分三大定律第三节布拉德福文献分散定律一.布拉德福及其文献分散定律1.S.C.布拉德福(1878—1948)英国著名的文献学家和化学家2.布拉德福设想:专业文献集中(1/3),分散于相关边缘期刊(1/3)和其他(1/3)3.期刊累计载文量大致相等的三个区域,这三个区域的期刊数量之比1:5:52分区论文数量期刊载文数量(篇/年)期刊数量a42949b4991-459c40412584.布拉德福关于文献分散现象的思考通过期刊相关论文载文率的高低进行区域划分,这些区域所含期刊的数目随着载文率的下降而增多,呈现反比例关系。以此可以定量测定学科间的联系程度和描述相关论文在登载其期刊中的数量分布。5.布拉德福定律的基本原理布拉德福定律的基本原理统计数据的处理,半对数坐标系区域表示法和图形表示法n1:n2:n3=1:a:a2n1:(n1+n2):(n1+n2+n3)=1:A:A2两种表示法的差异二.布拉德福定律的修正与发展1.维克利的修正式n1:(n1+n2):(n1+n2+n3):………=1:b:b2……….2.莱姆库勒对区域法的发展F(x)=ln(1+Bx)/ln(1+B)公式形式简单,单参数,便于应用。在确定了参数B以后,只要知道论文的覆盖比例就可以确定期刊的最低数量。3.布鲁克斯对图形法的发展anB(1nC)R(n)={klnn/s(CnN)参数讨论:1)当期刊总数N充分大时,N=K,N等于图形直线部分的斜率。2)S为重要参数,标度学科专业范围大小的指标。3)其他参数A=R(1),表示等级为1的期刊的载文量C为核心期刊数B为参数,等于曲线部分的曲线K为参数,等于直线部分的斜率三.布拉德福定律的应用1.确定核心期刊2.制定文献采购策略3.评价检索工作4.根据流通数据确定采藏策略第四节齐普夫词频—等级分布定律一.齐普夫与词频分布研究齐普夫的研究工作美国哈佛大学教授,语言学家词频分布的概念不同词汇的出现频次具有一定的统计规律性词频分布的早期研究编辑频率词典,频率与等级序号之间反比关系法国艾斯杜和美国康登的工作二.齐普夫定律的基本原理1.齐普夫第一定律fr=Cr-1其中:fr=nr/N为词汇出现的频率,r为词汇的等级序号。词频与等级序号间的一次反比律2.最省力法则人类行为与最省力法则—人类生态学引论。任何人在做任何事时,都希望付出的代价最小,而获得的收获最大。3.用最省力法则解释齐普夫定律齐普夫提出“单一化的力”和“多样化的力”作用概念。蒙代尔布罗从信息理论出发,建立广义齐普夫定律。4.齐普夫定律基本原理定律的文字与图象描述文字描述:frr=C图象描述:直角坐标系下为双曲线双对数坐标系下为直线5.齐普夫定律的局限性对高频词和低频词的解释存在不足三.齐普夫定律的理论发展主要研究方向:关于参数的讨论;关于低频词分布的推导,建立齐普夫第二定律。1.朱斯修正式fr.rB=C2.蒙代尔布罗修正式fr(r+m)B=C参数M主要功能是对高频词的修正。参数B用以描述低频词。M=0为朱斯修正式,B=1为齐普夫定律。3.布什低频词词频定律确定具有相同词频等级的方法(1)平均等级法(2)随机等级法(3)最大等级法齐普夫第二定律尽管文章的单词量各不相同,但是比值I1/D却十分接近。布什据此导出齐普夫第二定律,也称布什低频词词频定律。四.齐普夫定律的应用1.词表编制2.利用齐普夫定律,解决词汇控制,词表规模确定,选词标准等问题。3.文献标引控制齐普夫定律主要应用于统计标引法。确定有效词的词频值。从而可通过计算机确定有效词。4.情报检索的文献组织倒排档中,入档词出现的频次Pr=A/r(A近似为0.1),可确定倒排档大小。在科学评价中的应用1.加拿大蒙特利尔大学,纳米科研与发展报告79个关键词检索,8年中,50个高频词,25484篇,按国别分类,根据词频高低排序,分析各国研究优势与劣势。2.中草药文献,10年,MeSH词频排序,43个高频词,共现情况分析词间关联关系,中草药的研究热点。第五节文献信息作者分布规律-洛特卡定律三大基本定律之一(高产作者、核心期刊、高频词)1926年,《thefrequencydistributionofscientificproductivity》,作者数与论文的平方反比数
本文标题:信息计量学课件
链接地址:https://www.777doc.com/doc-2693043 .html