您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 基于网络信息计量的国内图书情报学科核心网站的测定
基于网络信息计量的我国图书情报学科核心网站的测定1.研究背景与目的背景(1)网络信息计量学的发展,很多三计学的研究方法都可以应用到网络信息计量学的研究中。本文主要是布拉德福德定律、百分比补偿法、影响因子等方法在网络中的应用。(2)网络环境中图书情报学科网站数量繁多而复杂,核心网站的测定有利于用户更好地利用图书情报学科的网络信息资源。(3)核心网站:许多学者尝试对核心网站进行定义,其中,杨海平、陆宝益和张天俊的观点为大多数学者所接受,他们认为:某一网站所发表的有关专业信息量在其所发布的所有信息中占有极大的比例,而且有较高的学术及实用价值,从中可以反映该学科、专业主题领域的最高研究水平、最新研究成果和发展动态,而且具有较高的相对稳定性和专业人士访问率。目的(1)检验布拉德福德定律在网络环境下的适应性问题(2)比较测定核心网站的不同方法2.研究样本与数据2.1研究样本的确定2.1.1图书情报学术组织网站(图书馆学会、科技情报学会、文献编目中心、calis)2.1.2图书情报期刊网站(41)2.1.3开设图书情报专业研究生教育的高等院校和科研机构网站(77)*2.1.4国内“211工程”高校图书馆网站(112)2.1.5国内省级及大型市级公共图书馆网站(34+)2.1.6国内大型科学、专业图书馆和信息中心(22)*样本的与处理:去掉重复的链接及死链。2.2研究数据的获取2.2.1google的检索方法关键词site:网址——网站内相关网页数量Site:网址——网站内网页数量Link:网址——网站的总入链数2.2.2检索词的确定国家社会科学基金项目是目前我国唯一的国家级的哲学、社会科学和人文科学的基金研究项目,它面向全国高校、社科院、党校、党政机关科研部门、军队院校等五大系统,被社科界视为衡量科研实力和科研组织能力的重要标志。从1994年起,国家社会科学基金资助项目中设立了“图书馆、情报与文献学”类,资助了一大批有关课题的研究,对提高我国图书馆、情报与文献学的研究水平起到较大的推动作用。对2008、2009两年社会科学基金项目中“图书馆、情报与文献学”类的项目研究主题进行内容频度分析,出现频度较高的主题词有图书馆、信息、服务、资源、数字、网络,说明这些主题是目前图书情报学科研究的热点。本文便以以上关键词对进行相关网页检索。2.2.3网站内网页数量的检索2.2.4网站内相关网页数量的检索2.2.5网站总入链数的检索2.3数据的预处理3.以相关网页数量为依据测定核心网站3.1基于布拉德福定律测定核心网站3.1.1图像分析法检验相关网页数散点图是否符合布拉德福分散曲线(假设结果符合)3.1.2区域分析法由表中数据可知,网站总数量N=233,全部233个网站的“相关网页数量”A=R(233)=48606,分别取区数m为3和6来计算布拉德福常数am(m=3,6)3.1.2.1传统分区方法的分析(即m=3)当m=3时,按照区域分析法,令每个区网站相关网页累计数量相等,其平均值为A/m=16202,按照这一平均值计算各区域中的网站累计数Nj(j=1,2,3)得到的区域分析的结果如下表所示。区号j第j区网站相关网页累计数量(=A/m)第j区网站累计数Nj布拉德福常数(a=Nj/Nj-1)11666610216299343.43154141895.5588总数A=48606总数N=233均值a3=4.47943.1.2.2非传统分区方法的分析(即m3)当m=6时,按照区域分析法,令每个区网站相关网页累计数量相等,其平均值为A/m=8101,按照这一平均值计算各区域中的网站累计数Nj(j=1,2,3,4,5,6)得到的区域分析的结果如下表所示。区号j第j区网站相关网页累计数量(=A/m)第j区网站累计数Nj布拉德福常数(a=Nj/Nj-1)1853032813672.333338020111.57144801722258160421.9091677431483.5238总数A=48606总数N=233均值a3=2.26753.1.2.3综合得出区域分析法的核心网站结果从上面两表可以来看,网站相关网页数的区域分析法结果并不理想,尤其是最后一区的网站数以及布拉德福常数明显偏大。但两种分区法仍可获得一些一致的结果,当m=3时,取第一区为核心网站区,也就是排名前十的网站为我国图书情报学科的核心网站;当m=6时,取第一和第二区为核心区,得到的结果与m=3时一样。下表中列出相关网页数排名前十的网站。排名网站所属机构相关网页数1厦门大学图书馆45402中国国家图书馆22003浙江省图书馆17904中国农业科技文献与信息服务平台13905中国图书馆学会12906图书情报知识11907中国科学技术信息所11408辽宁省图书馆10709南昌大学图书馆106010图书情报工作9963.2基于百分比补偿法测定核心网站3.2.1百分比补偿分析的原理根据网站拥有的主题相关网页与全部网页的百分比选择核心网站的方法,即是:将每个网站上拥有的主题相关网页与全部网页数的百分比大小排列起来,确定一个百分比,高于该百分比的网站即为核心网站。该方法的优点是不以绝对相关网页数为标准,从而使一些小型专业网站得以入选。13.2.2对网络站点的百分比补偿分析运用百分比补偿法公式“百分比=相关网页数量/网站网页总数*100%”,对233个样本网站分别进行百分比计算,将结果大于30%的网站列为核心网站,共有12个网站,如下表:排名网站所属机构百分比1西南交通大学图书馆100%2长安大学图书馆89.80%3中国科学院数学与系统科学研究院图书馆50.47%4江苏大学科技信息研究所47.49%5河南省图书馆47.37%6中国图书馆学会专业图书馆分会45.95%7北京交通大学图书馆45.22%8湘潭大学公共管理学院37.57%9中国科学技术情报学会竞争情报分会34.16%1袁毅,核心网站评选的理论与方法[m],南京大学10天津医科大学图书馆33.51%11广东图书馆学会33.33%12上海市科技情报协会32.83%4.以总入链数为依据测定核心网站4.1基于布拉德福定律测定核心网站4.1.1图像分析法检验相关网页数散点图是否符合布拉德福分散曲线(假设结果符合)4.1.2区域分析法4.1.2.1传统分区方法的分析(即m=3)由表中数据可知,网站总数量N=233,全部233个网站的“总入链数”A=R(233)=42773774,分别取区数m为3和6来计算布拉德福常数am(m=3,6)3.1.2.1传统分区方法的分析(即m=3)当m=3时,按照区域分析法,令每个区网站总入链数累计数量相等,其平均值为A/m=14257925,按照这一平均值计算各区域中的网站累计数Nj(j=1,2,3)得到的区域分析的结果如下表所示。区号j第j区网站相关网页累计数量(=A/m)第j区网站累计数Nj布拉德福常数(a=Nj/Nj-1)1140600005214293000224.43144207742069.3636总数A=48606总数N=233均值a3=6.88184.1.2.2非传统分区方法的分析(即m3)当m=5时,按照区域分析法,令每个网站总入链数累计数量相等,其平均值为A/m=8101,按照这一平均值计算各区域中的网站累计数Nj(j=1,2,3,4,5)得到的区域分析的结果如下表所示。区号j第j区网站相关网页累计数量(=A/m)第j区网站累计数Nj布拉德福常数(a=Nj/Nj-1)191100002283500006338827000142.333348535000322.2857579517741795.5938总数A=42773774总数N=233均值a3=3.05324.1.2.3综合得出区域分析法的核心网站结果从上面两表可以来看,网站总入链数的区域分析法结果也不是很理想,最后一区的布拉德福常数也是明显偏大,核心区的网站数也很难达到一致。相对来说,当m=5时,分区效果略微好些,因此取其前两区为核心区,核心网站数为8。下表中列出相关网页数排名前八的网站。排名网站所属机构网站总入链数1国家科技图书文献中心6,810,0002河海大学图书馆2,300,0003上海图书馆1,910,0004中国科学技术信息所1,640,0005北京科技大学图书馆1,400,0006清华大学图书馆1,170,0007中国图书馆学报1,130,0008中国科学院地理科学与资源研究所图书馆1,100,0004.2基于网络影响因子测定核心网站4.2.1网络影响因子的计算网络影响因子(Webimapctfactor,WIF)的计算方法一直都一个热点问题,不同的研究者提出了不同的网络影响因子计算公式,目前较为被认可的算法是用“外链数”除以“总网页数”。但是由于笔者所用的搜索引擎为Google,而Google的“网站外链数”检索结果目前并不为普遍认可,所以本文中的网络影响因子计算采用传统的以“总入链数”为分子,“总网页数”为分母的算法。4.2.2异常值的处理4.2.3数据分析和结果5.研究结论与讨论5.1两种测定方法的结果比较5.2研究的问题与不足基于网络信息计量的我国图书情报学科核心网站的测定1.研究背景与目的2.研究样本与数据2.1研究样本的确定2.1.1图书情报学术组织网站2.1.2图书情报期刊网站2.1.3开设图书情报专业研究生教育的高校网站2.1.4国内“211工程”高校图书馆网站2.1.5国内省级及大型市级公共图书馆网站2.1.6国内大型科学、专业图书馆和信息中心2.2研究数据的获取2.2.1google的检索方法2.2.2检索词的确定2.2.3网站内网页数量的检索2.2.4网站内相关网页数量的检索2.2.5网站总入链数的检索2.3数据的预处理3.以相关网页数量为依据测定核心网站3.1基于布拉德福定律测定核心网站3.1.1图像分析法检验相关网页数散点图是否符合布拉德福分散曲线(假设结果不符合)3.1.2排序分析法将所有网站按照相关网页数量进行降序排列并取排名靠前部分网站为核心网站3.2基于百分比补偿法测定核心网站3.2.1百分比补偿分析的原理3.2.2对网络站点的百分比补偿分析4.以总入链数为依据测定核心网站4.1基于布拉德福定律测定核心网站4.1.1图像分析法检验总入链数散点图是否符合布拉德福分散曲线(假设结果不符合)4.1.2排序分析法将所有网站按照总入链数进行降序排列并取排名靠前部分网站为核心网站4.2基于网络影响因子测定核心网站4.2.1网络影响因子的计算4.2.2异常值的处理4.2.3数据分析和结果5.研究结论与讨论5.1两种测定方法的结果比较5.2研究的问题与不足
本文标题:基于网络信息计量的国内图书情报学科核心网站的测定
链接地址:https://www.777doc.com/doc-2576361 .html