您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据挖掘与识别 > 大数据背景下的科研信息管理及科研统计-中国知网
大数据背景下的科研信息管理及科研统计关晓斌2018年8月30日提要一、科研信息管理二、大数据视角三、科研统计一、科研信息管理1、科研信息•基本信息和过程信息的集合–基本信息:科研人员、机构–过程信息:科研活动产生的过程数据、资料•科研管理实施的关键环节–产生于过程–服务于目标•过程–项目、成果、机构、学术交流等科研活动–与人事、财务、规划等业务对接、数据共享•目标–全流程管理:记录各类科研活动流程信息–发展状况:学者、学科、机构等–规划战略:优劣势分析、历史回顾–外宣交流:支撑科研拓展和交流2、科研信息管理的价值•实施科研管理•展示科研成效•分析发展趋势•支撑科研战略3、系统化需求•规范的管理流程、科研数据流•统一的科研管理信息数据平台•实时、准确的决策支持在线流程规范用户角色清晰数据存档完善多维数据互通数据服务便捷构建原则•架构优化、能适应政策变化•数据实时准确、扩展信息充分•业务流程完备、多部门数据共享•客观描述呈现、科学分析、支持管理决策预期成效•用户满意度–科研人员:科研简历一张表、项目管理在线办理–院系平台:科研组织、考核绩效–管理部门:流程规范、科研组织、统计、外宣–决策层:掌握科研进展,在点(重大科研进展)和面(各种口径统计报表)获得决策支持。案例•人民大学科研管理系统开发起步较早(2000年),最初为独立系统,2007年纳入学校“数字人大”整体系统运行至今,已有论文数据3万余条、项目数据1万余条、机构数据超过200条,累计用户超过5000人。•已实现与学校办公室、人事处、研究生院、财务处、教务处、图书馆等部门的数据共享。二、大数据视角1、何谓大数据•数据特征–非抽样数据而是全体–单元数据信息含量不高–非单一的数值化数据而是量化与质性数据共存•分析工具–关系分析–聚类–模式探索•数字化:得益于科研管理系统的普及•频发性:每天都有新数据产生•类型多样:文本、音视频、数据库•关联性:–以人员关联承担项目、产出成果–以项目关联成果情况、转化科研信息越来越符合大数据特征2、趋势背景•政策背景–“双一流”建设–教育信息化2.0–“放管服”、高校内控体系建设•数据推动(大数据)–科研信息多元化、频发化–科研系统管理普及–科研信息数据的应用场景多样化•技术支撑–科研数据库的规范性、关联性加强–科研管理系统电脑端、移动端•用户需求–教师用户行为习惯,档案在线存储使用普遍–管理部门对数据准确、及时的要求不断提高3、科研信息管理与大数据•数据入口:对接成熟数据库或管理系统•分析研究:引入统计学工具、深度挖掘关联性•信息产品:多维数据(复杂性)、集成信息(相关性)三、科研统计1、定位•科研统计涵盖数据采集、梳理整合、数据开发等,是科研信息的源头和核心运用。•科研统计–对外形成数据集和报表–对内支撑管理工作价值•状态描述:回答是什么和怎么样的问题•影响因素:哪些指标具有显著影响力•时间序列:变化趋势平稳与否、脉冲响应显著指标•热点分析:学科热点的发现、发展规律,可否提前引导2、思路•构建核心科研数据集,支持双一流建设与绩效评价–结合学科发展典型指标、学科评估及双一流建设绩效等评价体系,构建核心科研指标–尊重学科发展规律,设置分类评价指标体系案例一级学科评估指标•(一)哲学、文学、历史学门类•(二)经济学、法学、教育学门类•(六)管理学门类、统计学学科•(七)艺术学门类•(八)体育学学科数据来源:第四轮学科评估指标体系及有关说明,2016年5月25日一级指标二级指标三级指标三级指标说明数据来源C.科学研究水平(含教师和学生)C1.科研成果S11.学术论文质量①师均被SCI、SSCI、EI、A&HCI、CSCD、CSSCI收录的论文;②30篇代表性论文(国内论文不少于15篇,同一人员最多填写5篇),由专家参考论文引用、期刊档次等情况对论文的实际水平进行评价。公共数据/学校填报S12.出版专著近四年出版的学术专著(包括著、译著、编著,教材、教学用书不计入内);入选国家哲学社会科学成果文库或出版译本的专著加分。学校填报S13.出版教材近四年获批的“十二五”国家级规划教材与出版的“马工程教材”。公共数据C2.科研获奖S14.科研获奖①教育部高校科研成果奖(人文社科);②省级科研获奖(清单见附件2-1)、国家民委民族问题研究成果奖及其他部级科研获奖(获奖证书上需盖有关部委“国徽章”)。公共数据C3.科研项目S15.科研项目(含人均情况)①国家社会科学基金、全国教育科学规划课题、国家自然科学基金、国家软科学研究计划、教育部人文社会科学研究项目、全国高校古委会项目、国家清史纂修工程项目;②省部级及重要横向科研项目(限填30项)。学校填报•规范数据结构、丰富数据采集手段,提高基础数据质量–引入知网CNKI等覆盖全面、数据可靠的数据源规范数据结构–主推成果认领,为科研人员减负–科研简历“一张表”,提升服务案例论文数据采集整合•数据推送:从知网CNKI数据库等抓取推送•数据清理:作者认领、拓展信息•关联整合:以作者为主索引,关联项目、研究机构、学科•分析研究:–发文、引文、合作关系、基金支持–学科分布、历史变化、热点分析•形成数据集和统计报表,客观体现科研发展、全面展示科研实力–科研统计报表越来越成为各级主管部门全面掌握高校科研进展的核心渠道–科研统计数据已成为官方或非官方机构进行高校评价、学科评估等工作中所采用的最主要数据来源案例教育部科技统计年报数据来源:、科研信息数据开发数据挖掘综合评价、预测时间序列相关分析描述统计资料汇编案例1资料汇编•科技统计资料汇编•中国教育统计年鉴•研究生与学位白皮书•…案例2描述统计•百分比•频度•均值•离散情况•…200120022003200420052006200720082009201020112012201320142015图1中国人民大学新世纪以来项目经费情况总览(纵向、横向累积条状图)案例3相关分析•成果产出的相关因素分析–学科差异–承担项目的层级、结构–获得的经费额度–与评价制度的关系–与本人年龄、职称(包括任职年限)的关系常用工具:回归分析案例4时间序列分析图1北京地区高校教育经费图2北京地区高校教师人数图3北京地区高校在校学生人数案例5综合评价案例6数据挖掘•充分扩展数据范围,探寻新认识:–学科热点:从项目、成果题名寻找热点–创新团队:从项目合作、成果合著识别实质性团队–领军人物:叠加引证数据,结合团队分析–专家遴选:评审内容与专家领域匹配–人才发现:识别科研潜力人群(结合成果相关分析)常用工具:文本挖掘、决策树谢谢!
本文标题:大数据背景下的科研信息管理及科研统计-中国知网
链接地址:https://www.777doc.com/doc-5073900 .html