您好,欢迎访问三七文档
软件说明/IntroductionVersionSATI更新说明:1、【简介】【帮助文档】更新。2、添加中文分词等【实用工具】模块。文献题录信息统计分析工具(StatisticalAnalysisToolkitforInformetrics,SATI),通过免费、共享软件功能及开源、增进代码实现,旨在为学术研究提供数据统计与分析辅助工具。软件简介:背景:通过统计和分析期刊数据以挖掘出实用的模式和隐藏的信息,已成为识别学科热点或探索学科前沿的重要方法之一,而全文期刊数据库所收录的电子期刊文献自然成为数据源的首选。题录作为描述文献外部特征的重要条目集合,利用适当的信息抽取技术和定量分析方法,即可以题录为媒介,深入发掘和呈现出美妙的数据统计分析结果。对信息技术的掌握可使得我们编写出控制台程序或者窗体软件,以往需要进行大量手工分析运算的工作如今可以迅速直接的从数据本身得出结论。目前针对题录信息统计分析而开发的软件以国外较多,其数据源大都为国外数据库(WOS)导出文件,并且多为大型、复杂软件难以操作,为提供一个专门分析国内期刊论文题录信息,同时拥有分析WOS题录数据功能的小巧精准工具,以抽取指定字段信息、统计条目出现频率、构建知识单元共现矩阵,特作此软件和说明。目的:1、提供开源软件,辅助研究者统计分析文献题录信息或构建共现矩阵;2、只提供中间数据生成,不代表最终研究结果,即现成大型软件具备的后续功能(如基于词频排序构建图表,基于共现矩阵进行聚类分析、制作网络知识图谱等)自然不必开发;3、个人为学习.NET相关技术而作。方法:开发平台:.NETFramwork4.0;技术语言:C#,WinForm功能模块:1、字段信息抽取:支持WOS导出的HTML格式、EndNote格式和NoteExpress格式三种格式题录数据,抽取题录中指定的字段信息并可选择存储为文本文档(包括:自定义字段、关键词、主题词、作者、引文、机构、发表年、标题、期刊名、文献类型、摘要、URL等字段)。2、条目频次统计:根据抽取到的字段信息对条目内元素的频次进行统计和降序排列(包括:自定义标识、关键词、主题词、作者、引文、机构、发表年、标题、期刊、文献类型等)。3、共现矩阵构建:根据设定的共现矩阵行列数,将频次降序排列表中的相应数量条目元素作为矩阵知识单元进行运算,以构建知识单元共现矩阵(包括:关键词共现矩阵、主题词共现矩阵、作者共现矩阵、引文共现矩阵、机构共现矩阵等)并生成EXCEL格式文档,进而可以基于此矩阵文档导入相关软件(如Ucinet、Netdraw等可视化分析软件)生成共现网络知识图谱。提示说明:数据源:目前本软件支持三种格式题录数据(EndNote格式、NoteExpress格式和HTML(WOS)格式)。1、EndNote格式:推荐使用中国知网(CNKI)导出EndNote格式的题录数据,因为知网提供的EndNote格式题录数据较为完整,万方数据(WF)提供的EndNote格式题录数据中作者字段只显示第一作者。2、NoteExpress格式:推荐使用万方数据(WF)提供的NoteExpress格式题录数据,因为万方提供的NoteExpress格式题录数据较为完整,中国知网(CNKI)提供的此类数据缺少关键词字段数据。3、HTML(WOS)格式:WebofScience数据库平台导出的HTML格式题录数据。操作流程:具体参照软件【简介】—【帮助文档】。作者的话:有待完成:1、依据数据统计结果构建图表;2、直接对矩阵进行分析得出结论,并于软件本身呈现出可视化结果。3、添加智能信息处理相关技术功能模块(如聚类分析)。5/28/2011:一个星期时间规划、设计和开发出的软件自然不敢与同类大型工具软件相提并论,带着对.NET平台和C#语言的满腔热爱,在学习.NET相关技术的基础之上将C#和WinForm付诸实践,与花费的时间精力和消耗掉的脑细胞相比,这才是我最开心的事。就软件而言,较上个版本CS1,与Access数据库的链接功能模块已被删除,添加了设定矩阵行列数的功能,增加矩阵导出结果的EXCEL文档格式(最大100×100,毕竟高频词共现矩阵和高引(高产)作者合作矩阵才是有实际意义的),为后续导入可视化分析软件提供极大便利,鉴于国内全文期刊数据库导出的题录数据在格式统一度和信息量上的劣势,软件在字段抽取和信息统计的功能上只能做到此地步,相信随着技术的进步,此现象会有大改善。衡量软件实际意义的指标不仅包括用户使用量,还应加入使用者反馈信息,直接决定是否有必要继续设计和开发version3的,也不仅在于我是否有精力和兴趣去做这个事,还包括使用者对此软件的意见和建议反馈。如确有人用,或者确有需要改进的功能和升级的代码,届时自会再做CS3版本。7/11/2011:CS4版本更新名称为SATI(StatisticalAnalysisToolkitforInformetrics)。如有所想所说,来此找我:日帮助:废话少说,实例演示:1、分别检索WOS数据库平台和中国知网CNKI,导出2006-2010年图书情报学学科十种国际和国内核心期刊论文题录数据,先设定【题录格式】,然后选择【文件夹】方式将题录数据导入软件;2、选择要抽取的字段名称【关键词】,点击【抽取字段】按钮,抽取出关键词字段信息;3、点击【统计频次】按钮,对条目频次进行统计(如:得到关键词词频统计文档);4、在【行列数】文本框中设置矩阵行列数,点击【生成共词矩阵】按钮,生成共词矩阵(100×100的Excel格式和全矩阵.txt格式);5、将矩阵导入Ucinet进行高频关键词共现分析,根据频次属性设置节点大小与连线粗细程度,生成网络知识图谱;6、国际、国内高产作者合作矩阵、高产机构合作矩阵、共引矩阵等分析方法步骤同上。分别可得,国内图书情报学关键词共现网络知识图谱:国际图书情报学高产作者合作网络:国内图书情报学高产作者合作网络:国际图书情报学主要研究机构合作网络:国内图书情报学主要研究机构合作网络:
本文标题:软件说明-SATI
链接地址:https://www.777doc.com/doc-6221897 .html