您好,欢迎访问三七文档
决策树在学生成绩分析中的应用摘要:在学校管理工作中,特别是对学生的成绩管理工作中,普遍存在的问题是学生成绩数据量过于庞大,但对这些数据的处理还停留在初级的数据备份、查询及简单统计阶段,并没有对大量的成绩数据进行深入地分析,加以捕捉有利于教学管理工作的信息,这是对教学信息资源极大的浪费。数据挖掘技术正是解决这个问题的可行而有效的方法。关键词:决策树,学生成绩,数据挖掘TheApplicationofdecisiontreeinstudentperformanceanalysisAbstract:Inschoolmanagement,especiallyforstudentperformancemanagementwork,thecommonproblemisthestudentscoredataquantityistoobig,butfortheprocessingofthedatastillintheprimarystageofdatabackup,queryandsimplestatistics,notalotofanalysisofperformancedata,triestocaptureisadvantageoustotheteachingmanagementinformation,thisisagreatwasteofteachinginformationresource.Dataminingtechniqueisfeasibleandeffectivemethodtosolvetheproblem.Keywords:Thedecisiontree,studentachievement,datamining目录第一章引言······························································································11.1研究背景·····························································································11.1.1数据挖掘和决策树分类······································································11.2WEKA平台的简述··················································································2第二章决策树在学生成绩中的应用··································································22.1数据的预处理·······················································································22.2数据的训练集处理·················································································32.3数据的校验和成绩分析···········································································5第三章总结·····························································································5致谢····································································································6参考文献····································································································6附录····································································································61第一章引言1.1研究背景学生成绩是评估教学质量的重要依据现有教学管理系统中般仅有成绩的输入输出及简单的查询很少涉及成绩分析不利于充分挖掘分析这些数据所隐含的信息导致无法进行有效的教学评价利用数据挖掘技术可以从定量的角度精确地展现学生成绩分析的多个方面通过把数据挖掘技术引入到学生成绩分析中可以找出影响成绩变化的规律性的因素帮助制定相应的措施引导学生积极性。1.1.1数据挖掘和决策树分类数据挖掘(英语:Datamining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-DiscoveryinDatabases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于Associationrulelearning)的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。决策树是判定给定样本与某种属性相关联的决策过程的一种表示方法,从数据中生成分类器的一个特别有效的方法是生成一棵决策树,该方法广泛应用与数据挖掘和机器学习等领域,用来解释用分类相关的问题,决策树表示法是应用最广泛的逻辑方法之一。目前生成决策树方法的算法主要有三种:CART算法、ID3算法和C4.5算法。其中C4.52算法具有分类速度快且精度高的特点,是发展比较完善的一种决策树算法。1.2weka平台的简述WEKA是新西兰Waikato大学开发的全面的数据挖掘系统,它不仅提供了多种数据挖掘方法的多种常用算法进行知识发现,还提供了适用于任意数据集的数据预处理功能,以及算法性能评估的多种方法。本系统就是基于WEKA平台上对学生成绩进行决策树分析。第二章决策树在学生成绩中的应用2.1数据的预处理先调用出我们所需要的数据资料,本文采用的是的是2011级信管班2012-2013级第二学期的期末考试成绩。部分截图如下:姓名毛泽东思想与中国特色社会主义理论体系概论体育Ⅳ中国近现代史纲要JavaSE程序设计Net架构及应用电子商务包自强719383788686789581848793陈明强709567737790陈燕739771868585杜旭东699975878281付陇红759678777788甘圣738876717386高丽729678777989高泽仁679668757786郝政杰739879839085贺梦洁7110074727782金波749769827988表2.1然后对表进行预处理,预处理标准为:90-100分为A;80-89分为B;70到79为3C;60-69分为D;以及60分以下为E。量化处理后的数据部分截图如下:姓名毛泽东思想与中国特色社会主义理论体系概论体育Ⅳ中国近现代史纲要JavaSE程序设计Net架构及应用电子商务数据库原理包自强CABCBBDCABBBAA陈明强CADCCAD陈燕CACBBBB杜旭东DACBBBB付陇红BACCCBC甘圣BBCCCBD高丽BACCCBD高泽仁DADCCBD郝政杰CACBABD贺梦洁CACCCBC金波CADBCBC金苗CADBCBB李慧娟CADBCBB李琳CACCBAA李旋DACCCBD李亚兰CADCBBC李彦红CADBBBC李泽俊CABCBBD刘大伟CABCBAA刘丹霞CABCCBB刘蕊DACCBBB马霞CBDBCBC孟侨CABBABB屈艺晖DACBAAB任博洋DCCCBBD汝楠CACCBAB表2.22.2数据的训练集处理然后使用数据预处理后,开始归纳决策树,此过程使用数据预处理得到的训练集,4根据前述的决策树算法进行分类处理:图2.1生成的的决策树如下图所示:图2.2实例树/叶节点23456准确率71.93%86.67%83.33%80.00%66.67%5可以从准确率中看出,每个叶子节点的实例数为3。2.3数据的校验和成绩分析图2.5由实验可知学生成绩的分类规则如下:(1)if数据库原理=“A”or“B”or“Cand运筹学=‘B’”层次级别为优。(2)if数据库原理=“D”andjava=“C”and运筹学=“E”层次级别为一般(3)if数据库原理=“D”andjava=“B”and信息组织与检索=“D”层次级别为及格(4)剩下的分类全部属于良第三章总结本文主要对数据挖掘技术以及它在学生成绩中的应用进行分析,在目前手工方式进行6学生成绩分类效率低下的现实状况下,提出了关于学生成绩的数据挖掘模型,引入数据挖掘理论中的决策树算法,对高校学生成绩的数据进行分析,实验表明用此数据挖掘算法构造简单,能正确分类,处理速度快,最大的特点就是准确的了解到学生成绩差异薄弱环节。尤其是对于现实中数据量很大的时候,决策树方法非常的有用,有效的减轻了工作量并缩短的了工作时间,提高了高校教学质量和老师的教学方向,并且在高等教育教学薄弱环节的改善和重点学科培养方面最出了很大的贡献(小四号字空一行)致谢本论文是在学校学老师的指导下完成的,本次论文从选题到完成,每一步都是在老师的悉心指导下完成的,倾注了老师大量的心血。在此,谨向导师表示崇高的敬意和衷心的感谢!在写论文的过程中遇到了很多问题,在老师的耐心指导下,问题都得以解决。再次感谢老师对我的帮助。参考文献[1]何文秀.数据挖掘技术在高校就业工作中的应用研究[J].现代计算机:专业版,2008(3):16-18.[2]丁智斌,袁方董,贺伟.数据挖掘在高校学生学习成绩分析中的应用[J].计算机系统应用,2006(4):33-36.[3]张云涛,龚玲.数据挖掘原理与技术[M].电子工业出版社,2004:28-30.附录数据原表姓名毛概体育Ⅳ现代史纲要JavaSE程序设计Net架构及应用电子商务数据库原理数据库原理实验信息组织与检索运筹学总分层次划分包自强71938378868666906566784良78958184879391907782858优陈明强70956773779060906063745一般陈燕73977186858585957181829优杜旭东69997587828185906786821优付陇红75967877778876907474805优7甘圣73887671738660853952703一般高丽72967877798960857560771良高泽仁67966875778660906341723一般郝政杰73987983908565857166795良贺梦洁71##7472778277806458755良金波74976982798876956585810优金苗78926581768783857270789良李慧娟76956782768782858275807优李琳74##7378889294857089843优李旋68967176798860856655744一般李亚兰70976179888976907074794良李彦红68986882888975857373799良李泽俊67958173868661806160750良刘大伟79968379879490808176845优刘丹霞76978175798285807579809优刘蕊6894
本文标题:决策树论文
链接地址:https://www.777doc.com/doc-5584907 .html