您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 基于共词分析的近十年国外图书情报学研究主题分析
基于共词分析的近十年国外图书情报学研究主题分析王莉亚/张志强/卫军朝2012-10-2216:43:17来源:《情报杂志》(西安)2011年3期【英文标题】OnForeignStudySubjectsofLibraryandInformationScienceBasedontheCo-wordAnalysisduringtheLastTenYears【作者简介】王莉亚(1979-),女,中国科学院国家科学图书馆在读博士,中国科学院研究生院,研究方向为战略情报理论研究与方法(北京100190);张志强(1964-),男,博士生导师,中国科学院国家科学图书馆兰州分馆,研究方向为战略情报理论研究与方法(兰州730000);卫军朝(1980-),男,中国科学院国家科学图书馆在读博士,中国科学院研究生院,研究方向为数字图书馆与情报分析技术(北京100190)。【内容提要】以Scopus数据库和WebofScience数据库共同收录的图书情报学领域的38种期刊近十年(2000-2009年)所刊载的研究论文为数据源,利用Bibexcel矩阵生成软件和SPSS10.0统计软件,采用共词分析方法研究高频关键词间的关系,发现并深度剖析目前国外图书情报学领域所关注的7个研究主题,即用户技术接受行为研究、网络环境下信息交流研究、知识管理研究、网络信息检索、信息政策研究、图书馆馆际互借研究和信息服务研究。ThepurposeofthispaperwastoanalyzetheresearchsubjectsoflibraryandinformationscienceoutsideChina.Thispaperadoptedco-wordanalysismethodandusedtheSPSSandBibexcelastoolstodealwiththekeywordsfrom38libraryandinformationsciencejournalscollectedbyScopusandWebofsciencefrom2000to2009.Thepaperanalyzedsevenresearchsubjectsoflibraryandinformationscience,whichincludedtechnologyacceptancebehaviorofuser,informationcommunicationofnetworkenvironment,knowledgemanagement,informationseekingofnetworkenvironment,informationpolicy,interlendingoflibraryandinformationservice.【关键词】共词分析/研究主题/多元统计分析Co-wordanalysis/Researchsubject/Multivariatestatisticalanalysis了解国外同行的研究动态,可以为我国图书情报学的建设和完善提供有益的借鉴,因此许多学者纷纷从定性和定量的角度对国外图书情报学领域的主题进行了多角度分析。但是随着信息技术的飞速发展、新技术的应用和开辟,我们有必要重新整理与总结这一领域的研究,以促进图书情报学研究的发展。同样是关于图书情报学主题分析的研究,本文更多地从图书情报学研究的不同方向进行主题内容分析总结,在保证一定广度的基础上突出深度。1数据来源Scopus是荷兰著名的出版商Elsevier公司于2004年11月正式推出的新产品,是目前全球规模最大的文摘和索引数据库。相对于其他单一的文摘索引数据库而言,Scopus的内容更加全面,学科范围更加广泛。特别是在获取欧洲及亚太地区的文献方面,它包含了10%左右的亚洲文献,其中27%是中国的文献。2007年Scopus共收录图书情报学领域的期刊116种,SSCI共收录了56种期刊,二者重复收录的期刊数为38种。本文以这38种期刊近十年(2000-2009年)所刊载的研究论文(article)为数据源。2010年4月份,以“出版物名称”为检索口从Webofscience数据库中获得有效分析论文7133篇。2数据处理SCIE论文的关键词分两种,一种是作者关键词(DE字段),另一种是增补关键词(ID字段)。增补关键词是ISI根据参考文献的标题中摘取的主题词,许多专家对其评价也比较高,但是详细分析增补关键词的内容后,我们发现它对文献主题内容的反映不够准确。为了全面反映近十年图书情报学领域研究的主题内容,采用了将二者相结合的办法,即将两种关键词进行合并,并删除重复的内容。在本文的样本中,有4318篇论文给出了作者关键词,有5592篇论文给出了增补关键词,有2777篇文献既有作者关键词又有增补关键词。对数据处理清洗后,最终得到关键词13297个,累计频次为44904次,篇均关键词为6.3个。按照词频由高到低进行排序,并截取频次高于50的关键词,共计104个,删除频次最大的internet(602次)后,最终进行分析的关键词共有103个,如表1所示。由于这些关键词是图书情报学相关研究论文中出现频次较高的词,它们在很大程度上可以体现国外图书情报学研究主题的发展状况。在高频词统计的基础上,本文利用Bibexcel矩阵生成软件和Matlab共同建立103*103共词矩阵。该矩阵是对称矩阵,其中主对角线上的数据定义为缺省值,非主对角线上的数据表示两个关键词共同出现在同一篇论文中的次数。共词矩阵显示了两两关键词共现频次情况,高频关键词共现频次高,低频关键词共现频次低,共现频次超过100次的只有system和IT这对关键词。从共词矩阵很难看出关键词之间所呈现的关系,因此需要借助多元统计分析方法来揭示这些关键词之间的关系,继而分析关键词所代表的研究主题的内容和相互关系。具体分析如表1所示。3多元统计分析3.1分析方法和步骤利用SPSS软件进行多元统计分析。首先验证数据样本类型,通过验证,相关矩阵数据不符合正太分布和均匀分布。然后利用SPSS13.0将共词矩阵转化为Pearson相关矩阵,最后在此相关矩阵的基础上进行多元统计分析。3.2因子分析因子分析的核心思想是用较少的互相独立的因子反映原有变量的绝大部分信息。将相关矩阵导入SPSS13.0,利用主成分法、协方差矩阵与平均正交旋转方法进行因子分析,最终可得到主成分列表,如图1所示。图1中列出了所有的主成分,它们按特征根从大到小排列,放弃特征值小于1的主成分,前6个主成分解释了总变量的93.853%。表2显示了因子负载大于0.5的关键词在6个因子中的分布情况。结合图1和表2因子分析结果如下:a.因子命名。大部分关键词都分布于相应的因子,只有4个关键词由于其载荷系数小于0.5而未能参与分类,它们是“design”、“e-government”、“documentdelivery”和“interlending”。表明这些关键词的使用在学者之间并没有达成共识,或者是其代表的主题较狭窄,没有很好地同其他研究方向相结合。根据因子载荷大于0.7就对因子解释有帮助的原则,并综合因子中其他关键词的属性,本文给出了6个因子的名称分别是:因子1:网络信息检索,因子2:用户技术接受行为研究,因子3:知识管理,因子4:网络环境下信息交流研究,因子5:信息服务研究,因子6:信息政策研究。b.关键词跨区分布情况。共有16个关键词跨区分布。因子3和因子4中同时出现了“impact”、“knowledge”、“knowledgemanagement”、“network”、“implementation”、“work”、“issue”;第1和第2个因子中同时出现了“web”;因子2和因子4中同时出现了“quality”、“computer”;第4和第6个因子中同时出现了“service”、“government”;因子1和因子5中同时出现了“userstudy”、“informationmanagement”、“research”;因子2和因子3中同时出现了“decisionmaking”。这表明了上述两两因子相互渗透和交叉。c.关键词的因子载荷系数为负的分布情况。共有12个关键词的因子载荷系数为负,同相应因子构成负相关关系,一般对此类因子不予考虑。例如在因子6中的“library”是负值,这表明关于“library”的研究可能也涉及信息政策方面的问题,但是还是比较少,因此相关度还是比较低。然而,在因子5中的11个因子载荷系数均为负值,一般对因子命名没有贡献,但是由于其数量比较多,反而成为主流。3.3聚类分析词对在同一篇文献中的共现频次,反映了词对间关系紧密的程度。聚类分析就是对共词关系网络中的词与词之间的距离进行数学运算分析,将距离较近的词聚集起来,形成一个个相对独立的类团,使得类团内属性相似性最大,类团间相似性最小。本文在Pearson相关矩阵的基础上,利用SPSS13.0进行性层次聚类,选择离差平方和法与离散数据类型中的斐方方法进行聚类分析。聚类结果如图2所示,共分为7个类团。图2分层聚类结果综合因子分析和聚类分析的结果,可以看出大多数关键词在两种分类方法的分布中很稳定,尤其是核心关键词(即因子分析中载荷系数超过0.7)更是具有超强的稳定性,这表明国外图书情报学的研究结构已经形成并趋于稳定。但是有一部分关键词分布发生变动。例如因子2:用户技术接受行为研究中的“determinant”、“trust”、“satisfaction”、“e-commerce”、“acceptance”、“adoption”都渗透到聚类结果3知识管理中,这表明了这两个主题研究内容的融合与交叉。同时,在因子分析中由于因子载荷小于0.5而未出现的“documentdelivery”和“interlending”在聚类分析中聚合成一类。这表明了虽然图书馆馆际互借仍然是该领域的一个研究主题,但是随着图书馆数字化的发展,它受关注的程度在逐渐降低。4研究主题分析结合词频和多元统计分析结果以关键词为检索口从源数据中获得相关主题的文献,并根据文献题目从数据库中检索相关文献的全文,通过深入分析文献的内容最终获得相关主题的研究内容。4.1用户技术接受行为研究近年来,在全球化趋势和信息技术革命的影响下,社会各界越来越重视信息技术在组织中的应用问题。虽然关于信息技术实施过程中用户行为的研究由来已久,但关于用户行为对信息技术的接受和采纳一直是组织最终能否真正应用信息技术的关键问题之一,该领域问题一直受到学术界的关注。从相关文献的内容分析可以看出,近10年来技术接受行为研究的内容主要分为如下三个方面:a.技术接受模型(TAM)的研究。2003年Venkatesh[9]等在比较分析了理性行为理论、技术接受模型、动机模型、计划行为理论、技术接受模型与计划行为理论的整合模型、计算机利用模型、创新扩散模型、社会认知模型等8个模型的基础上,提出了一个技术接受和使用统一模型。该模型主要用于评价新技术的引入及其应用,帮助技术开发者识别技术接受行为的驱动力,从而促使用户接受并使用信息系统。随后相关研究者还从不同角度分析TAM中出现的问题[10],通过加入不同的变量对其进行拓展和修正[11]。中国学者ZhangN.等[12]基于信息技术接受模型理论并结合中国文化的特点提出了一个以用户为中心由认知有用性、使用便捷和认知契合3个决定因素组成的IT/IS评价模型。HeinrichsJH等[13]基于技术接受模型提出了适合专业图书馆网站使用的替代模型——“双中介影响”模型。该模型包括了感知易用性、感知有用性、服务功能和任务功能4个直接或间接影响着用户的满意度和使用意愿的因素,描述了决定一个专业图书馆网站使用的内在和外在因素之间的关系。b.影响技术接受意愿和行为的因素分析。感知有用性和易用性是影响技术接受的两个关键因素[14]。为了深入分析技术接受意愿和行为,研究者在前期模型的基础上,通过实证研究不断充实新的关键因素。例如在网络环境中分析“趣味性(playfulness)”
本文标题:基于共词分析的近十年国外图书情报学研究主题分析
链接地址:https://www.777doc.com/doc-3727778 .html