您好,欢迎访问三七文档
科学计量学提纲第一章科学计量学概述第一节科学计量学的形成与发展一.科学计量学的概念1.科学计量学的形成现代科学技术的发展促进科学本身的发展现代数学的发展促进各门学科的数学化和计量化现代科学活动的日益社会化是科学计量学发展的条件和动力2.科学计量学的概念科学计量学定义和概念的演变和进步科学计量学定义:博采各种数量技术,定量地研究科学技术进步的发展规律和内在机制。3.文献计量学、科学计量学和情报计量学三个相关术语的定义三个相关术语的相互联系与区别二.科学计量研究的原理和方法1.科学计量研究基本原理科学计量研究的特点科学计量研究的类型2.科学计量研究常用方法出版物数量计量方法著者数量计量方法引文分析方法词频分析方法内容分析方法统计分析方法3.科学计量研究的局限性4.统计数据的经验分布1)统计量或统计累积量按时间的分布统计量~时间分布N~t变化速度~时间分布dn/dt~t通过微积分运算可求出许多重要的累积分布例如:dn/dt=k=N=kt+N0线性增长分布注意:引文出版年龄的概念2)半对数与对数分布半对数坐标系:(X,㏒Y)或(㏒X,Y)布拉德福分布对数坐标系:(㏒X,㏒Y)洛特卡分布一般说,在对数坐标系中,等量的线性位移可以表示变量的等比例变化,这时常可使非线性关系转化为线性关系。例如:Y=Cax(指数函数)㏒Y=㏒C+X㏒a=㏒Y=AX+BY=BXa(幂函数)㏒Y=㏒B+a㏒X=㏒Y=a㏒X+C3)科学计量指标的频次分布研究频次分布的意义研究文献统计数据的集中与分散现象,以及科学工作者集中与分散处理数据的行为。利用频次-等级或频次-规模方法处理数据,就会表现出文献的集中与分散现象。频次—规模分布:f(X)~X特例:洛特卡分布频次—等级分布:g(r)~r特例:齐普夫分布,布拉德福分布三.科学计量研究的发展1.科学计量研究发展简史创立时期(19世纪末~20世纪30年代)19世纪重要科学家:德堪多和高尔顿代表著作:《二百年科学和科学家的历史》、《遗传天赋》和《英国科学家》20世纪主要研究工作:科尔和伊尔斯的文献统计分析休姆的文献增长研究和提出统计书目学术语格罗斯夫妇的引文分析研究洛特卡的科学生产率研究布拉德福关于文献分散定律的研究齐普夫关于词频分布的研究理论形成时期(20世纪30~60年代)重要科学家:贝尔纳、普赖斯、默顿重要著作:《科学的社会功能》、《科学与社会》、《巴比伦以来的科学》、《大科学、小科学》应用发展时期(20世纪60年代~现在)重要科学家:加菲尔德、布劳温2.我国的科学计量研究思考题1.科学计量学的形成与发展。2.谈谈你对科学计量学各种定义的认识和理解。3.科学计量研究的常用方法有哪些,它们与自然科学研究有哪些区别和差异?4.简述科学计量研究的发展过程。5.科学计量指标的频次分布有哪些类型?说明其意义和作用。第二节科技文献的老化规律一.科技文献的老化现象1.科技文献老化的概念2.情报老化与文献老化的区别3.影响文献老化的因素:1)文献内容发生变化的2)文献增长对老化的影响3)学科性质差异的影响4)学科发展阶段对老化的影响5)用户需求对老化的影响二.文献老化过程的定量研究1.文献老化过程的定量研究方法1)文献流通统计数据分析法2)引文分析法引用文献分析法(同时法)被引文献分析法(历时法)2.模拟老化过程的数学模型1)负指数模型布鲁克斯的基本假设负指数模型的形式C(t)=Coe-bt=Ke-bt观察SCI的引用数据表概率密度函数f(x)=be-bx累计分布函数F(t)=1--e-bt老化系数a=e-b2)伯顿-开普勒公式y=1--(a/ex+b/e2x)(a+b=1)3)莫德列夫修正式y=1--(a/ex-0.1+b/e2x-0.2)(a+b=1)三.老化速度的测度指标1.半衰期和中值引文年龄两种定义的区别贝尔纳定义适用于历时法伯顿—开普勒定义适用于同时法(中值引文年龄)SCI中的引用半衰期和被引半衰期定义2.计算方法作图法、公式法3.普赖斯指数定义的表述普赖斯指数与中值引文年龄的区别4.老化系数测度文献老化速率的重要参数其值大则老化慢,其值小则老化快四.文献老化规律的应用1.在文献管理中的应用2.在科学学和科技史研究中的应用第三节布拉德福文献分散定律一.布拉德福及其文献分散定律1.布拉德福与文献工作2.S.C.布拉德福(1878—1948)英国著名的文献学家和化学家3.文献杂志——Documentation4.布拉德福关于文献分散现象的思考通过期刊相关论文载文率的高低进行区域划分,这些区域所含期刊的数目随着载文率的下降而增多,呈现反比例关系。以此可以定量测定学科间的联系程度和描述相关论文在登载其期刊中的数量分布。5.布拉德福定律的基本原理布拉德福定律的基本原理统计数据的处理,半对数坐标系区域表示法和图形表示法n1:n2:n3=1:a:a2n1:(n1+n2):(n1+n2+n3)=1:A:A2两种表示法的差异二.布拉德福定律的修正与发展1.维克利的修正式n1:(n1+n2):(n1+n2+n3):………=1:b:b2……….2.莱姆库勒对区域法的发展F(x)=ln(1+Bx)/ln(1+B)公式形式简单,单参数,便于应用。在确定了参数B以后,只要知道论文的覆盖比例就可以确定期刊的最低数量。3.布鲁克斯对图形法的发展anB(1nC)R(n)={klnn/s(CnN)参数讨论:1)当期刊总数N充分大时,N=K,N等于图形直线部分的斜率。2)S为重要参数,标度学科专业范围大小的指标。3)其他参数A=R(1),表示等级为1的期刊的载文量C为核心期刊数B为参数,等于曲线部分的曲线K为参数,等于直线部分的斜率三.布拉德福定律的应用1.确定核心期刊2.制定文献采购策略3.评价检索工作4.根据流通数据确定采藏策略第四节齐普夫词频—等级分布一.齐普夫与词频分布研究齐普夫的研究工作词频分布的概念词频分布的早期研究法国艾斯杜和美国康登的工作二.齐普夫定律的基本原理1.齐普夫第一定律fr=Cr-1其中:fr=nr/N为词汇出现的频率,r为词汇的等级序号。2.最省力法则人类行为与最省力法则—人类生态学引论。任何人在做任何事时,都希望付出的代价最小,而获得的收获最大。3.用最省力法则解释齐普夫定律齐普夫提出“单一化的力”和“多样化的力”作用概念。蒙代尔布罗从信息理论出发,建立广义齐普夫定律。4.齐普夫定律基本原理定律的文字与图象描述文字描述:frr=C图象描述:直角坐标系下为双曲线双对数坐标系下为直线5.齐普夫定律的局限性对高频词和低频词的解释存在不足三.齐普夫定律的理论发展主要研究方向:关于参数的讨论;关于低频词分布的推导,建立齐普夫第二定律。1.朱斯修正式fr.rB=C2.蒙代尔布罗修正式fr(r+m)B=C参数M主要功能是对高频词的修正。参数B用以描述低频词。M=0为朱斯修正式,B=1为齐普夫定律。3.布什低频词词频定律确定具有相同词频等级的方法(1)平均等级法(2)随机等级法(3)最大等级法齐普夫第二定律尽管文章的单词量各不相同,但是比值I1/D却十分接近。布什据此导出齐普夫第二定律,也称布什低频词词频定律。四.齐普夫定律的应用1.词表编制2.利用齐普夫定律,导出被引文献与叙词使用频率的分布特征,解决词汇控制,词表规模确定,选词标准等问题。3.文献标引控制齐普夫定律主要应用于统计标引法。确定有效词的词频值。从而可通过计算机确定有效词。4.情报检索的文献组织倒排挡中,入挡词出现的频次Pr=A/r(A近似为0.1),可确定倒排挡大小。第五节科学知识指数增长规律一.科学知识指数增长规律1.科学知识按指数增长的规律恩格斯指出:科学按加速度发展,即按指数函数增长规律性发展。图书文献的增长科学知识的增长科学指标的翻番时间2.普赖斯文献增长公式N=N0ebt半对数坐标系LnN=bt+LnN0其中b为文献连续增长率(或称增长系数)在一般情况下,可近似认为b=r(年相对增长率)所以计算时可用年相对增长率代替b。3.翻番时间计算d=Ln2/b=0.693/b可见b是很重要的量。二.指数增长规律机理分析1.基本机理事物的增长速度与现存的事物数量成正比。即:dN/dt=bNdN/N=bdt=LnN=bt+C=N=N0ebt2.指数增长规律的局限性3.智力潜热现象科学技术发展的波浪式前进,永无止境。4.科技文献增长的四个阶段科技文献的阶跃型增长曲线三.逻辑斯蒂增长曲线1.逻辑增长模型原指生物学中的“生长曲线”,描述生物界一类典型的繁殖过程,即开始阶段按指数规律增长得很快,但随着时间的推移,繁殖速度减慢,并逐渐趋于不增。一般称为饱和的指数增长曲线。2.逻辑曲线的机理分析逻辑模型与指数模型的关系dN/dt=bN(k–N)与dN/dt=bN普赖斯指出:科学发展的所有明显的指数型终将成为逻辑型模型。指数型是逻辑型的发展的初始阶段,而逻辑型是指数型最终的发展趋势。逻辑型曲线的局限性是导致科学发展的极限论,增长率为零。3.普赖斯—纳里莫夫循环曲线4.科学知识增长规律总结四.科学文献增长的一般模型1.科学文献增长一般模型将dN/dt=qN变易为dN/dt=q(t)N,然后两边积分。2.不同质量科学文献的增长模型雷舍假设,雷舍模型第六节科学生产率的洛特卡分布一.科学生产率研究与洛特卡定律1.科学生产率研究洛特卡的研究工作科学生产力—在给定时间内,科学工作者所发表的论文数量。2.洛特卡定律lnfx=-2lnx+lnCfx=C/X2利用级数可定义C值,C=0.6079fx=0.6079/X2C值的实际意义是f1的数值,即发表过一篇论文的作者数所占的比例。洛特卡定律的文字表述二.洛特卡定律的修正与推广1.洛特卡定律的局限性统计数据不全合著者处理过于简单高产作者的处理2.洛特卡定律的修正与推广广义洛特卡定律fx=C/Xa(1.2a3.8)3.普赖斯定律完成该专业论文总和一半的高产作者的人数在数量上应等于该专业作者总数的平方根。M值的确定。杰出科学家人数与全体科学家总数的比例R。三.洛特卡定律的应用与评价1.洛特卡定律的应用2.洛特卡定律数据规范化处理第七节文献计量学理论模型研究一.经验双曲分布系与负幂分布1.布拉德福现象(布-齐-洛分布系)2.布鲁克斯关于信息源(Source)和信息单元(iterm)的提法。3.负幂型分布P(x)=C/xP二.文献计量学理论模型简介1.布—齐分布系统一概率模型的研究西蒙的斜分布函数族泊松分布模型普赖斯的累计优势分布布恩斯坦的经验负幂分布布鲁克斯的混合泊松模型巴瑞尔的贝塔—负二项分布西切尔的通用逆高斯—泊松分布模型三.存在问题与发展趋势思考题1.说明研究文献老化规律的意义和方法。2.布拉德福定律的文字表述和图象表述是什么?说明它们之间的主要区别。3.简述齐普夫定律,并用最小省力原则解释齐普夫定律的机理。4.科学知识数量增长规律的概念是什麽?有哪几种表达形式?5.洛特卡分布的表达式是什麽?它的推广形式有哪些?第二章引文分析方法第一节引文与引文分析一.基本概念1.参考文献与引用文献(引文)普赖斯的定义参考文献——Reference引用文献——Citation注意:人们常常称参考文献为引文。2.引文网络文献相互引证的关系结构3.引文分析引文分析的定义,引文分析的发展,引文分析的应用,引文分析的意义。二.引用行为和引用动机科学工作者的引用行为是科学活动中普遍存在的现象,是科学交流不可缺少的一部分。引用动机——包括正常动机和反常动机由于反常引用动机的存在,影响引文分析的客观性和准确性。第二节引文分析基本方法和指标一.两类基本方法引文直接分析方法和引文聚类分析方法二.引文直接分析方法准备工作主要引文分布文献的自引分析三.引文分析基本指标四.加菲尔德与科学引文索引(SCI)1.科学引文索引(SCI)2.科学引文索引的结构引文索引来源索引主题轮排索引3.科学引文索引的优点和功能第三节科学期刊的引文分析一.期刊引文分析与文献集中规律被引文献高度集中现象加菲尔德文献集中定律二.评价期刊的主要指标期刊载文量期刊引用率期刊被引率平均引文率影响因
本文标题:科学计量学
链接地址:https://www.777doc.com/doc-3940065 .html