您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 聚类技术在学生成绩分析中的应用
陕西理工学院毕业设计聚类技术在学生成绩分析中的应用【摘要】数据挖掘技术是信息技术研究的热点问题之一。目前数据挖掘技术在商业、金融业等方面都得到了广泛的应用,而在教育领域的应用较少,随着高校招生规模的扩大,在校学生成绩分布越来越复杂,除了传统成绩分析得到的一些结论外,还有一些不易发现的信息隐含其中,因而把数据挖掘技术引入到学生成绩分析中,有利于针对性地提高教学质量。聚类分析是数据挖掘中的一个重要研究领域。它将数据对象分成为若干个簇,使得在同一个簇中的对象比较相似,而不同簇中的对象差别很大。本论文就是运用数据挖掘中的聚类分析学生成绩的,利用学生在分专业前的各主要学科的成绩构成,对数据进行选择,预处理,挖掘分析等。运用聚类算法分析学生对哪个专业的强弱选择,从而为具有不同成绩特征的同学在专业选择及分专业后如何开展学习提供一定的参考意见。【关键词】数据挖掘;聚类技术;学生成绩;K-means陕西理工学院毕业设计.TheApplicationofClusterTechnologyinAnalysisforStudents’AchievementAbstract:Thetechnologyofdataminingisoneofthehotissuesintheinformationtechnologyfield.Nowadaysdataminingtechnologyiswidelyusedinbusinessandfinance.Butitislessusedineducationfield.Withtheincreaseofenrollmentinuniversities,therearemoreandmorestudentsincampus,andthatmakesitmoreandmorecomplexinthedistributionofstudentsrecords.Besidessomeconclusionsfromtraditionalrecordanalysis,alotofpotentialinformationcannotbefounded.Importingthedataminingtechnologytostudentsrecordanalyzingmakesitmoreconvenientandimprovetheteachingquality.Clusteringanalysisisanimportantresearchfieldindatamining.Itclassifydataobjecttomanygroupssothattheobjectissimilarinthesameclusters,differentinthedifferentclusters.Inthispaper,clusteringtechniqueindataminingisusedtostudents'performanceanalysis,theuseofdatastructureofmainsubjectbeforethestudentsspecializedinchoiceofmode,pretreatmentanddatamining.Usingclusteringtechnologytoanalysewhichprofessionalstudentsaregoodat,soastochoosehowtolearnprofessionalandgivesomereferenceopinionsafterstudentsofdifferentgradeschoosetheirmajors.Keywords:DataMining;ClusterinTechnology;Students'Achievement;k-means目录陕西理工学院毕业设计引言..............................................................................11概述...........................................................................21.1课题背景..................................................................21.2发展现状..................................................................21.3课题意义..................................................................31.4本文研究内容.............................................................32数据挖掘理论概述..........................................................42.1数据挖掘概述............................................................42.1.1数据挖掘的定义.....................................................42.1.2数据挖掘的过程.....................................................42.2聚类分析..................................................................52.2.1聚类分析概述........................................................52.2.2聚类分析原理方法..................................................52.2.3聚类分析工具........................................................63算法介绍.....................................................................73.1K-means算法................................................................73.1.1K-means算法描述.......................................................73.1.2k-means算法的特点....................................................84聚类分析的应用.............................................................94.1算法实现..................................................................94.1.1数据准备.............................................................94.1.2数据预处理.........................................................104.1.3算法应用............................................................114.2结果分析.................................................................134.2.1聚类结果............................................................134.2.2结果分析............................................................194.3结论......................................................................19总结...........................................................................20致谢...........................................................................21参考文献.......................................................................22科技外文文献.................................................................23中文译文.......................................................................26陕西理工学院毕业设计第1页共27页引言在高校学生成绩管理中,影响学生学习成绩的因素很多,因此要进行综合分析。传统分析无非是得到均值、方差等一些简单的分析结果,往往还是基于教学本身。其实,还有一些教学中不易察觉的因素和教学以外的因素影响学生学习成绩,这些都需要进一步分析,从而得出结论,为教学管理人员及学生做出相应的决策。而这些信息是无法从传统的学生成绩分析方法中获得,但可以通过从20世纪90年代中期兴起的数据挖掘技术中获得,从而找到影响学生学习成绩的真实原因,制定相应措施,提高教学效果。数据挖掘是一种决策支持过程,是深层次的数据信息分析方法,将数据挖掘技术应用于教学非常有益,它可以全面地分析学生成绩与各种因素之间隐藏的内在联系。比如,经过对学生成绩相关数据库系统的分析,数据挖掘工具可以问答诸如“哪些因素对学生的学习成绩可能有影响”等类似的问题,这是传统方法无法达到的。通过数据挖掘分析,其结果可能给教学带来一定的收获。总之,随着数据量的急剧增长和对数据提取的更高要求,现在我们很难再依照传统方法在海量数据中寻找决策的依据,这就必须借助数据挖掘法发现数据中隐藏的规律或模式,为决策提供更有效的支持。虽然数据挖掘作为一种工具,它永远也不能替代教师的地位,但是它可以为教师的决策提供科学的依据。数据挖掘技术本身就是人们大量实践的结晶,它为建立传统教学中很难获取或不可能获取的模型提供了捷径。从高校当前实际出发,将数据挖掘技术引入到学生考试成绩分析中,建立一个通用的考试成绩科学化管理的总体框架是非常有益的。实践表明,数据挖掘能够为教学改革提供有效的理论与实践决策依据,在分析影响高校学生学习成绩因素中具有较好的作用。把这个思想推广开来,将数据挖掘技术应用在高校教学的各个方面,会得到大量的有现实意义的结果,从而制定相应的措施,来达到最终目的以提高教育教学质量。陕西理工学院毕业设计第2页共27页1概述1.1课题背景随着我国经济的发展,网络已被应用到各个行业,人们对网络带来的高效率越来越重视,然而大量数据信息给人们带来方便的同时,也随之带来了许多新问题,大量数据资源的背后隐藏着许多重要的信息,人们希望能对其进行更深入的分析,以便更好地利用这些数据,从中找出潜在的规律。那么,如何从大量的数据中提取并发现有用信息以提供决策的依据,已成为一个新的研究课题。高校是教学和科研的重要基地,也是培养人才的重要场所,教学管理工作当中的学生成绩分析是高校管理工作的一个重要组成部分,也是衡量高校管理水平的依据。从目前来看。各高校随着招生规模的扩大,信息量大幅
本文标题:聚类技术在学生成绩分析中的应用
链接地址:https://www.777doc.com/doc-5266740 .html