您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 近十年我国图书情报学科研究热点的共词分析
近十年我国图书情报学科研究热点的共词分析王红2012-10-2721:52:09来源:《情报学报》(京)2011年7期【英文标题】Co-wordAnalysisontheHotspotsinChineseLibraryandInformationSciencefortheLastDecade【作者简介】王红,女,1984年生,湖北汽车工业学院图书馆员,研究方向:信息计量学。E-mail:wanghongrose@126.com,十堰442002【内容提要】本文以五年为一个时间段,采用共词分析方法对1998-2007年我国图书情报学科8种核心期刊文献中的高频关键词分别进行聚类分析与类团关系分析,列出了两个阶段聚类结果的类团关系表,绘制了两个阶段的类团关系图,并对这两个阶段我国图书情报学科的热点研究领域和主要研究领域进行了较为详细的对比分析,以期从微观层面上对我国图书情报学科不同时期的研究热点和主要研究领域进行揭示与把握。从分析结果上看,我国图书情报学科的研究热点具有一定的传承性、连续性、稳定性、发展性、阶段性和变化性的特点。Fiveyearsasaperiod,thispaperusestheco-wordanalysismethodtoperformclusteranalysisandclusterrelationshipanalysistothehigh-frequencykeywordsofeightcorejournalsofChineseLibraryandInformationScience(abbreviationLIS)from1998to2007.Atthesametime,thepaperdrawstherelationtableofclusteringresultsanddraftstherelationshipfigureofcluster,andsystematicallyanalyzestheresearchhotspotsofChineseLISindifferentperiod,inordertorevealmicroscopicallytheresearchhotspotsofChineseLISindifferentperiod.Tosumup,theresearchhotspotsofChineseLIShasacertaincharacteristicsofinheritance,continuity,stability,expansibilityandvariability.【关键词】共词分析/图书情报学科/聚类分析/类团关系分析Co-wordanalysis/Libraryandinformationscience/Clusteranalysis/Clusterrelationshipanalysisl引言随着全球化、信息化时代的到来,我国图书情报学科经历了巨大变化。面对学科的巨大变革,我国图书情报学界同仁迫切希望系统、全面、直观地了解近十年来它的热点研究领域有哪些,学科结构又如何,学科发展的脉络趋势是什么,网络的普及和电子资源的广泛使用给它带来了什么影响?而共词分析法主要是利用大量文献中的共同出现的关键词对来反映文本关键词之间的关联强度,进而确定该文献集所代表学科和主题结构的研究热点及变化趋势。它的原理主要是两两统计一组关键词在同一篇文献中共同出现的频率,利用包容系数、聚类分析等多种统计分析方法,把众多分析对象之间错综复杂的共词网状关系简化为用数值、图形直观地表示出来[1]。鉴于此,本文将采用共词分析法对1998-2007年我国图书情报学文献中的高频关键词进行共词分析,深入揭示其研究结构,系统探讨其研究维度、学科背景和理论基础,以期从微观层面上对我国图书情报学科不同时期的研究热点和主要研究领域进行揭示与把握。2实验数据与方法2.1数据来源本文选取CSSCI中收录的1998-2007年的8种图书情报学核心期刊为样本,套录8种期刊10年文献的题录信息,并自建其题录数据库。利用C#自编的计算机程序统计,共得到14847篇文献,18562个关键词。八种期刊是:《中国图书馆学报》、《大学图书馆学报》、《图书馆工作与研究》、《图书馆理论与实践》、《情报科学》、《情报学报》、《情报资料工作》、《情报理论与实践》。2.2数据处理说明为了能更好地展示近十年来我国图书情报学科研究热点的变迁,本文将全部数据分成1998-2002年、2003-2007年两阶段,分别统计出两阶段的关键词总数为9732个和11706个;再按照这些关键词出现频次由高到低排序,得到两阶段降序排列的关键词词频分布表。按照科学计量学的原理,目前高频词的确定主要有两种方法:一种是结合研究者的经验在选词个数和词频高度上平衡,该方法具有一定的主观性;一种是结合齐普夫第二定律辅助判定高低频词的界限[2]。为保证共词分析的效果,本文根据这些关键词的累计频次变化曲线,截取每个阶段词频大于22的关键词。得到了1998-2002年前120个高频关键词和2003-2007年前156个高频关键词。然而,虽然CSSCI已经进行了人工标引规范,但是本文在数据处理过程中,还是发现有些不规范的词汇,如因特网、互联网与Internet,本体、Ontology与本体论,大专院校、高等学校与高等院校等。为规范处理,本文将类似性质的同义词汇进行归并、整理,这样第一阶段的前120个关键词简化为100个,第二阶段的前156个关键词简化为129个,从而分别确定两阶段的100个和129个高频关键词表(表1、表2)作为我国图书情报学科研究热点的基础。2.3构造原始共词矩阵、相关矩阵和相异矩阵由于构建的相关矩阵中的0值过多,统计时容易造成误差过大,为了方便进一步处理,用1与全部相关矩阵中的数据相减,得到表示两词对相异程度的相异矩阵,作为后面聚类分析的矩阵变量。2.4聚类方法本文采用聚类分析法中最常用的系统聚类法,对两阶段的共词相异矩阵进行聚类分析。聚类方法选择组间距离法,点间距离的测度方法选择目前最常用的欧氏距离。2.5构建类团关系图类团形成后,通过计算各类团之间的外部链接和内部链接,可以得到各类团的内部与外部联系强度。外部链接指两个类团的所有关键词共同出现在同一篇论文中的次数总和,内部链接指某类团所包含的全部关键词共同出现在同一篇论文中的次数总和。计算每个类团的内部链接和外部链接,并按照链接强度绘制成类团关系图,可以反映各类团间的关系。本文首次尝试利用先进的社会网络分析软件pajek对类团关系图的绘制方法进行改良[4,5],绘制出的两阶段类团关系图既能反映出类团本身的内部联系强度,又能显现出一个类团与其他类团的外部联系强度,使类团关系图的关系更简明、清晰、形象、直观,并能快速定位出核心类团与非核心类团。3实验结果与分析3.1总体状况1998-2002年共有6320篇论文,年均1264篇,篇均关键词为3.92个。经过规整、缩减后,这一阶段频次大于22的高频词共100个。其中,图书馆、数字图书馆、高校图书馆、信息服务、信息资源、网络环境等关键词出现200次以上,说明网络环境下以图书馆为核心的信息资源建设是这一阶段的研究热点。通过对这100个高频词共词矩阵的聚类,在分类阈值为2.2水平上得到15个类团。其中有14个关键词聚成了由两个关键词组成的7个小类团,还有两个类团各包容的4个和5个关键词,因共词聚类自身的局限性造成其主旨杂乱,无助于类团的命名。这些关键词均被忽略掉。因此,15个类团共包含77个关键词。2003-2007年共有8527篇论文,年均1705.4篇,篇均关键词为3.64个。两阶段发文篇数不均衡的原因是,《图书馆理论与实践》和《情报科学》两种刊物自2000年起,年均发文篇数增幅较大。经过规整、缩减后,这一阶段频次大于22的高频词共129个,图书馆再次以869次居于首位,数字图书馆、高校图书馆、信息服务、知识管理、信息检索、网络环境等关键词出现200次以上。可见,在这一阶段人们更加注重通过对网络环境下的知识管理和信息检索的研究来提升图书馆信息服务的能力。第二个阶段的聚类结果显得比较分散,同样在分类阈值为2.2水平上却得到了20个类团。其中有4个关键词未聚入任何类目,有24个关键词聚成了由2个关键词组成的12个小类团,另有2个类团各包容的3个关键词,同样因共词聚类自身的局限性致使其主旨杂乱,无助于类团的命名。这些关键词均被忽略掉。因此,20个类团共包含95个关键词。为了较为清楚、直观、形象地展示近十年我国图书情报学科的主要热点研究领域,清晰反映各类团之间的联系,揭示各类团发展的状况,本文列出了两阶段的聚类结果的类团关系表,绘制了两阶段的类团关系图进行对比分析。3.2研究主题变迁两阶段聚类结果的类团关系见表3。从聚类结果看,第一阶段我国图书情报学科的主要热点研究领域有15个类团,根据学科的研究主题总结为以下8个方面:1)网络环境下的信息资源建设研究这是目前我国图书情报领域研究成果最丰硕的部分。该类团群包括“网络环境下的图书馆信息资源建设研究”、“复合图书馆研究”、“电子出版物研究”、“资源共享研究”四个类团。从关键词聚类分析结果来看,该阶段网络环境下的图书馆信息资源建设已不再仅仅局限于传统的藏书建设,开始向高度自动化、电子化、网络化、虚拟化的深度和广度进军。2)信息检索研究该类团群包括“文献信息检索研究”和“网络信息检索研究”两个类团。信息检索一直是图书情报工作的研究热点,不过研究的重点在不断的变化。该阶段对文献信息检索的研究主要偏重于联机检索系统、检索方法的比较与应用的研究,而网络信息检索主要侧重于对网络信息资源(Web、Internet)搜索引擎的研究。3)知识管理研究包括“信息组织与知识组织研究”和“知识管理研究”两个类团。据关键词分析可知,该阶段的研究人员越来越关注元数据的应用研究,即元数据的信息组织方式(信息组织、知识组织、XML等)。同时对知识管理的研究也比较务实,更加注重知识管理在企业管理中的运用,以及知识管理带来的知识创新和社会效益等。4)图书馆管理与服务研究管理与服务是图书机构永恒的话题和研究的重点。该阶段的研究主要偏重于传统图书馆向现代图书馆转型和过渡形势下,图书馆的管理模式与读者服务方式的研究。5)企业信息化及信息化社会研究该类团群包含“企业竞争情报研究”、“网络信息安全研究”和“信息化社会研究”三个类团。这一时期对企业信息化的研究不再像20世纪那样,主要注重理论、方法的探讨,而是更强调应用研究,如企业信息化与竞争情报、与电子商务、与网络信息安全、与信息政策、与信息产业等的研究。6)文献计量学研究广大研究者主要关注的是图书情报学核心期刊引文的计量分析,这也是文献计量学领域的主要研究方法和工具,多数的分析研究都是基于此的。7)信息素质教育与人才培养研究该阶段研究者们主要关注的是在高等教育中如何提高学生的信息素质和信息能力,而对我国图书情报学专业人才的培养关注较少。8)分类编目研究分类编目是图书馆进行文献整理的一项主要工作,历史悠久,基础深厚,是图书馆学中较为成熟的分支学科,其中编目的前提与基础(分类法)、编目标准化(机读目录)、现代化(计算机编目)、共享化(书目数据库)是该学科中主要的研究课题。在第一阶段该研究主题仍然受到重视。同1998-2002年相比,2003-2007年我国图书情报学的主要研究热点发生了一些明显的变化。这一阶段虽然有些类团依然保留下来,但是类团的研究主题已发生变化,同时部分类团发生分解,出现了一批新类团。这一阶段的研究热点根据学科的研究内容总结为以下9个方面:1)网络环境下的信息资源建设研究与第一阶段相比,该类团群的研究热点与重点已发生变化,具有鲜明的时代特征,含有“资源共享研究”、“数字资源研究”和“数字图书馆知识产权研究”三个类团。网络环境下的信息资源建设不仅更加注重数字资源的整合和特色数据库的建设,也更加注重图书馆联盟的运转机制和模式的探讨,以期进一步发挥文献信息资源共建共享的优势。与此同时,研究者们也注意到了大量
本文标题:近十年我国图书情报学科研究热点的共词分析
链接地址:https://www.777doc.com/doc-3319760 .html