您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 科学知识图谱CiteSpace利用方法
„科学知识图谱基本理论CiteSpace使用方法主要内容应用案例分析科学知识图谱基本理论•科学知识图谱知识背景•科学知识图谱基本方法•科学知识图谱作用科学知识图谱基本概念科学知识图谱是显示科学知识的发展进程与结构关系的一种图形以科学知识为计量研究对象,属于科学计量学范畴在以数学方程式表达科学发展规律的基础上进而以曲线形式将科学发展规律绘制成二维图形,即知识图谱科学知识图谱基本原理科学知识图谱研究是一个以科学学为基础涉及应用数学、信息科学及计算机科学等交叉科学领域,是科学学和信息计量学的新发展基本原理是分析单位(科学文献、科学家、关键词等)的相似性分析及测度。根据不同的方法和技术绘制不同类型的科学知识图谱科学知识图谱科学知识图谱研究进展传统的科学计量学图谱以简单的二维、三维图形(如:柱形图、线性图、点布图、扇形图、平面图等)表达科学统计结果010203040501234010203040501234系列1系列30501001502001234某学科某结构三维图文献摘要或关键词纪录比例图X论文增长趋势线型图现代科学知识图谱11987年,美国基金委发表研究报告《科学计算中的可视化》,开始长期资助科学可视化(scientificvisualization)研究1987年,著名计量学家克雷奇默创立“三维构型图谱”threedimensionalconfigurationmap之后出现“多维尺度图谱”multi-dimensionalscalingmap20世纪20、30年代英国人类学研究提出“社会网络分析图谱”socialnetwortanalysismap卡尔提出“自组织映射图谱”self-organizingmap用二、三维图像表征物理现象的科学可视化图交互性不强,但对非物理现象,如文献数据集、网络通道模式等信息可视化计算交互性很强实例:某学科期刊高频关键词共词网络2个知识群实例:某学术群体知识图谱现代科学知识图谱2PFNET算法根据经验性数据,对不同概念或实体间联系的相似性或差异程度做出评估,然后引用图论中的基本概念或原理生成特殊的网状模型1990美国心理学家斯克沃斯兹恩巴克提出“寻径网络图谱”pathfindernetworkscalingmap,PFNET将数据以及数据间关系表达成一个图,图中节点表示数据,线表示数据间关系运用较小生成树法及复杂连接删除算法,删除网络中大部分连接,保留最重要连接,最大限度简化网络现代科学知识图谱3用克林伯格跳变算法和共生词分析法和图示技术,研制主要主题和复杂趋势的发现地图印第安纳大学KetanKMane和泊尔纳提出“PNAS主题爆炸图谱”•网络中各节点代表高频词和爆炸词•节点大小代表该词达到最大爆炸水平•颜色代表词常用和达到最大爆炸水平的年代现代科学知识图谱4利用地理信息系统的可视化信息,地理地图的自然组织框架,构建成隐含大量信息的可视化主题地图有维斯等提出“信息地图”informationlandscape应用案例:期刊文章的数量与资助基金间的动态关系图谱科学知识图谱应用展望1随计算机处理能力日益提高,文献信息电子化和专利授权,知识图谱等工具在模拟人类数据分析等方面,可帮助人类进行某些领域的判读、搜索、决策、预测……IN-SPIRE发现工具可整合交互式信息可视化与询问功能利用专利分析工具形成的专利知识图谱论文的最小生成树图谱最小生成树导航图谱科学知识图谱应用展望2明确主要研究领域、专家、机构、出版物等关键词及其之间的内部联系明确主要研究领域之间的知识输入与知识输出科学研究领域的动态变化(如:增长速度、多样化)信息生产和传播中的经济因素科学社会网络明确战略的作用和政府项目的应用研究企业、机构、研究的竞争态势与竞争力科学知识图谱基本理论•科学知识图谱知识背景•科学知识图谱基本方法•科学知识图谱作用科学知识图谱基本方法引文分析理论与方法CitationAnalysis共被引分析理论与方法co-citationAnalysis多元统计分析方法词频分析方法社会网络分析方法SocialNeworkAnalysis利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引用与被引用现象进行分析,以便揭示其数量特征和内在规律的一种温馨计量分析方法——邱均平《文献计量学》把文献的共被引分析作为计量文献之间关系的一种新方法,即当2篇文献共同出现在第3篇文献的参考文献目录中,这2篇文献就成为共引关系。共被引频率定义为这2篇文献一起被引用频次——马沙科娃、斯莫尔(苏联、美国科学记录学家)对若干相关的随机变量观测值的分析,包括:因子分析、多维尺度分析和聚类分析。这些方法将在关系矩阵上运算。典型例子引文分析,如牙买加某领域文献群组的共被引矩阵引证——埃格赫《信息计量学导论》是计量学中传统方法。在文学中,不同词汇的使用与出现频率是有一定规律的——齐普夫《齐普夫第一定律》将社会结构界定为一个网络,网络由成员之间的联系进行连接,社会网络分析更多地聚焦于成员之间的联系而非个体特征,并把共同体视为“个人的共同体”,即视为人们在日常和生活中所建立、维护并应用的个人关系的网络——Wetherell等科学知识图谱基本理论•科学知识图谱知识背景•科学知识图谱基本方法•科学知识图谱作用科学知识图谱应用—引文分析引文分析理论与方法1、说明科学知识和情报内容的继承和利用2、标志科学的发展科学知识图谱应用—共被引分析1、从分析被引文献类型、语种入手,可研究科学文献体系的特征结构及分布、利用等规律2、从分析被引文献网络及其变化,可研究学科间关系、联系特征、发展变化现状、发展趋势共被引分析理论与方法科学知识图谱应用—多元统计分析因子分析以较少几个因子描述许多指标或因素间关系,即把较密切的变量归在同一类,每类变量成为一个因子,以这些少量的因子反映原资料中大部分信息。其中的主成分分析与科学计量学分析结合,能确定科研人员群体或国家科学领域的分布状况因子分析•多维尺度分析通过低维(2维)空间反映作者(文献)间的联系,利用平面距离来反映作者(文献)间的相似程度。在科学知识图谱中,作者(文献)的位置显示其相似性,高度相似的聚在一起,形成科学共同体(学科前沿),中间位置的作者(文献)并与其他作者(文献)联系越多,说明其在学科位置越核心,反之则处于外围科学知识图谱应用—词频分析在任何文章中,词的出现频率都服从一规律:文章中每个词出现词频次统计后按照高频次词在前、低频次词在后的递减顺序排列,并用自然数给这些词标上等级序号,形成f〃r=C定量形式(f=频次r=序号C=常数)词频分析方法序号频次关键词1242imidazoliumionicliquid234Phosphonium-DerivedIonicLiquids……近10年ionicliquid研究词频统计科学知识图谱应用—社会网络分析社会网络分析方法CiteSpace使用方法•CiteSpace介绍•CiteSpace使用CiteSpace介绍研究背景研究前沿的知识基础在科学文献中(即有引用研究前沿术语的科学文献所形成的演化网络)的引文和共被引轨迹CiteSpace1、研读引文2、分析结论3、咨询专家CiteSpace使用1、数据保存2、数据格式数据准备1、导入数据2、调谐数据系统使用1、判读图谱2、获取引文图谱运用分析结论CiteSpace使用——文献检索/数据保存ORGREENBL,1990,JAPPLSOCPSYCHOL,V20,P1033HANSONRF,1995,JCONSULTCLINPSYCH,V63,P987HARVEYAG,1999,JCONSULTCLINPSYCH,V67,P985CiteSpace使用——文献检索/数据格式WebofSciencCSSCI(ChineseSocialScienceCitationIndex)PubmedNSFDerwentScopusarxive-PrintCNKISDSS(SloanDigitalSkySurvey)A:AuthorsB:Title,Descriptors,AbstractC:CitedReferencesD:TimesCitedE:YearofPublicationCiteSpace用的书目记录信息CiteSpace用的共被引记录信息AUGalea,SAhern,JKilpatrick,DBucuvalas,Mco-authorshipATIPsychologicalsequelaeoftheSeptember11SONEWENGLANDJOURNALOFMEDICINELAEnglishDTArticleIDPOSTTRAUMATIC-STRESS-DISORDER;NATIONALABBackground:post-traumaticstressdisorderco-occurringbursttermsBauthorco-citationCKESSLERRC,1995,ARCHGENPSYCHIAT,V52,P1048KILPATRICKDG,1987,CRIMEMAZURECM,2000,AMJPSYCHIAT,V157,P896NORTHCS,1999,JAMA-JAMMEDASSOC,V282,P755documentco-citationCRESNICKH,1999,JANXIETYDISORD,V13,P359RESNICKHS,1993,JCONSULTCLINPSYCH,V61,P984ROTHBAUMBO,1992,JTRAUMASTRESS,V5,P455journalco-citationCCiteSpace数据来源CiteSpace使用——系统使用/导入数据点击进入网络版系统CiteSpace使用——调谐数据点击导入数据选择导入数据年代选择数据切分年代选择聚类词来源选择聚类词型选择聚类点类型阈值调谐,调整聚类节点与研究等关系连线阈值调谐数年段内引文数年段内聚类点年段内连线数剪切连线选择可视图显示形式CiteSpace使用——图谱判读1最小生成树合并网动画图谱突显点表示新兴学科各色圆环标识为高共被引文献聚类节点,表示学科或研究的热点、前沿领域颜色及厚度反映研究年代及被引次数节点大小与位置分别表示研究多少和核心层度各色连线表示首次共被引年代CiteSpace使用——图谱判读2显示聚类节点及其标题词的图谱聚类标题词显示研究前沿主题聚类环包括一组相关节点各节点对应一高引文献CiteSpace使用——图谱判读3研究进展时间图按年代显示研究前沿聚类标题词表示研究热点CiteSpace使用——图谱判读4研究进展时区图CiteSpace使用——分析结论/研读高共引文提取研究热点对这些高引频(高中心度)文献进行研读,分析得出研究热点CiteSpace使用——分析结论/研读高频引文获取发展趋势通过高共被引文献的高引频文献内容研读,得到学科、研究的发展趋势CiteSpace使用——分析结论/依据时区图得到研究进展点开各时区内各节点文献进行内容研读,得到研究进展态势应用案例分析•以“六维力传感器发展趋势”为例应用案例分析步骤明确研究主题背景研究主题文献检索CiteSpace图谱分析科研交流与把关研究热点及发展趋势分析与报告应用案例分析步骤——明确研究主题背景通过与中科院等离子体研究所学科调研了解需求经过专业文献学习了解本专题专业知识明确:1、六维力传感器的专业背景2、研究所需要了解“六维力传感器理论及技术近年研发前沿、热点及发展趋势”应用案例分析步骤——研究主题文献检索文献库及检索式的确定文献检索及数据准备数据库:SCI-WOS、EI、DII等检索式:six-axis(forceORtorqueORmomentORStewartplatform)sensor*ANDrobot文献检索:在SCI-WOS库查到131条记录数据准备:选择记录并以download*.txt文件名保存应
本文标题:科学知识图谱CiteSpace利用方法
链接地址:https://www.777doc.com/doc-3233539 .html