您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 数据挖掘技术在网络自主学习平台中的应用(本科毕业论文)
目录摘要:..............................................................2Abstract:...........................................................2引言................................................................2一.网络自主学习平台分析............................................3二.数据挖掘基本知识................................................4(一)数据挖掘基本概念............................................4(二)相关技术介绍..............................................4三.学生课程智能推荐功能的实现......................................6(一)课程推荐的思路............................................6(二)具体实现..................................................6四.学生成绩评估功能的实现..........................................8(一)数据准备..................................................9(二)数据挖掘中决策树构造算法..................................9(三)结果分析.................................................10五.改进模型.......................................................10六.结束语.........................................................12参考文献:.........................................................12致谢................................................错误!未定义书签。数据挖掘技术在网络自主学习平台中的应用摘要:随着Internet的推广,自主学习模式的推行,基于网络的自主学习平台发展迅速,但很多自主学习平台都存在一些不足之处。文章对吉首大学信息管理与工程学院自主学习平台进行了分析,也对存在的两个主要不足之处(缺乏课程推荐功能,缺乏对学生成绩进行评估的功能)进行了说明。然后重点阐述利用数据挖掘技术来实现功能,其中运用到的主要技术分别是聚类分析和决策树分类,针对该平台提出了一个改进模型,体现了数据挖掘技术在网络自主学习平台中的应用。关键字:数据挖掘;自主学习;网络自主学习平台;k-means算法;ID3算法。ApplicationsoftheNetworkSelf-learningPlatformBasedonDataMiningTechnologyAbstract:WiththeInternettopromoteandtheimplementationofself-learning,web-basedforself-learningplatformisdevelopingrapidly.butmanytherearesomeshortcomings.Inthearticle,Ianalysistheself-learningPlatformforJishouUniversityofInformationManagementandEngineering.andtheexistenceoftwomajordeficiencies(thelackofcoursesrecommendedfeatures,thelackofassessmentofstudentachievementfunction)aredescribed.Andthenfocusesontheuseofdataminingtechniquestoachievethefunction,whichappliedtothemaintechnicaldifferenceistheclusteranalysisanddecisiontreeclassifier.finallyproposeanimprovedmodel.Itreflectsthedataminingtechnology’applicationsinthenetworkself-learningplatform.Keywords:datamining;self-learning;networkself-learningplatform;k-meansalgorithm;ID3algorithm.引言近几年来,随着教育事业的不断发展,各种教学方法和模式得到了尝试,其中自主学习模式得到了绝大部分人的推崇。教学开始从传统的完全以老师教为主,向以学生自主学习为主,老师指导为辅的新模式转变。网络技术、多媒体技术等信息技术的发展也为自主学习平台提供了技术支持。网络自主学习平台开始广泛运用到教学和自主学习中。用户差异性大、处理数据量大是网络自主学习平台的特点,要想从中得到有用信息,可以运用数据挖掘技术来实现。数据挖掘技术在网络自主学习平台中的应用变得非常之重要。一.网络自主学习平台分析网络自主学习平台,是提供给学习者实现自主学习的一个网络平台,以网络为技术基础。学习者借助平台希望能更好的进行自主学习。自主学习是一种主动的、建构性的学习,学生自己确定学习目标,监视、调控由目标和情境特征引导和约束的认知、动机和行为。自主学习模式不受时间、空间和地域的限制,通过计算机网络可扩展至全社会的每一个角落,甚至是全世界,这是真正意义上的开放性学习和自主学习。文章将对吉首大学信息管理与工程学院自主学习平台进行研究。该平台用于本院两个本科专业学生(信息管理与信息系统,电子商务)自主学习和辅助教师教学,分为三大模块:系统管理员模块、学生模块、教师模块。系统管理员模块,主要是对用户注册登录、用户信息、权限设置进行管理;学生模块,学生注册登录平台后,可以根据的自己的需要和兴趣选择不同的课程进行学习、进行网上作业和在线测试、阅读相关资料;教师模块,教师登录后,可以进行资料的上传、作业上传、设置课程等活动。系统功能图如(图1):(图1)该平台的优点:学生能够根据自己的兴趣、需要自主选课;实现了学习的网络化,学生的学习可以不受时间、地点的影响,学生能更方便的进行学习。老师可以将信息量大的教学资料上传到平台中,这样会更有效率;平台中提供了全面的学习资料,利于扩展学生的知识面;在线作业、在线测试更利于学习。该平台存在的一些不足:(1)课程推荐。系统中,教学材料和教学过程方案千篇一律,无论哪一个学生访问该平台,提供的课程几乎都是一样的,不能根据学生的自身条件提供适合于其自身的学习内容,不能根据不同学生进行课程推荐。课程推荐功能的实现后,当用户再次访问平台时,系统能够根据历史学习行为和用户的兴趣特征,来对目标用户进行课程的推荐,尽可能更好的符合用户的兴趣爱好,这样能调动学生的极性和进行自主学习的耐心。从而最终达到帮助学生学习的目的。(2)学生成绩评估的功能。对于学生的成绩,系统不能对其进行评估。学习效果不能得到体现,无法找出影响成绩的有效因素。平台实现学生成绩自动评估功能,当将学生的成绩录入系统中后,能够自动对学生成绩进行分析和评估,自主学习平台教师模块学生模块系统管理员模块系统信息管理用户信息管理数据维护基本信息设置课程学习测试作业上传资源管理课程管理学生作业管理找出影响成绩的原因能够更好的指导学生的学习,同时对于老师的教学也起到了指导性的作用,为更好的进行教学提供帮助。(3)必要的交互。学生之间、学生跟老师之间,不能进行很好的交流,不能充分调动学生的学习主动性。(4)信息反馈系统。学生在学习过程中只有及时得到反馈信息,并不断调整学习策略进行学习强化,才能改正错误。学生不能得到适当的反馈信息,学习者在学习中带有盲目性,降低了学习效率。对于该平台存在的不足,在此选择课程推荐功能和学生成绩评估功能进行研究。经分析发现,可以运用数据挖掘技术来实现。文章重点说明用数据挖掘技术来实现这两个功能。二.数据挖掘基本知识(一)数据挖掘基本概念数据挖掘(DataMining,简称DM),简单地说,就是从大量数据中挖掘或抽取出知识。关于数据挖掘的具体定义常常取决于定义者的观点和背景,比较公认的定义是:数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的、人们事先不知道但又潜在有用的信息和知识的过程。它涉及对数据库中大量数据进行抽取、转换、分析和其他模型化处理,从中提取辅助决策的关键性数据。数据挖掘可以视为另一个常用的术语数据库中的知识发现的同义词。数据挖掘技术常用方法:关联规则、分类技术、预测技术,聚类分析、异常数据挖掘等。数据挖掘技术在国外的大型商业、金融业、保险业、医疗、通信、运输等大型企业得到了广泛应用,国内目前总体上还处于理论探讨和应用试验阶段。在商业,数据挖掘可用于发现新的购买趋势、新的市场规律和发掘新策略等;在金融业,数据挖掘可用于信用卡分析、信贷分析等。数据挖掘技术在网络自主学习平台中的应用也越来越广泛。(二)相关技术介绍本文在此主要运用到两个算法:k-means算法和决策树ID3算法。(1)k-means算法,即k-均值算法。它依据每个类的重心相似度量方法把n个数据分成k个类,使类内部相似度较高,类间相似度较低。算法:①随机选择k个点作为k个类的重心,即平均值②将剩余n-k个点分别分到k个点最接近的类;③计算这k个类的重心和聚类评价函数E,重复进行,直到评价函数不再改变或各类中的点不再发生改变。评价函数E为:E=kicixxxdiii1,2k:是要聚成的类的数量。Xl:是类Cl的重心。具体步骤如下:要分类的簇的数目k,要聚类的学习者交互信息的集合X={x1,x2,x3,…,xn}。步骤1:任意选择k个点x1,x2,x3,x4……,xn作为k个类C1,C2,C3,C4…Cn的重心。步骤2:对数据点xi。若xi到xj的距离最小,j=1,2.,…,k,j≠i,把xi分到Cj类中。步骤3:计算评价函数E。步骤4:计算各类的重心,并计算新的评价函数E’。步骤5:若E=E’或各类没有变化,结束;否则,返回步骤2继续进行。运用k-means方法进行聚类,关键在于计算簇中心,以及k值选择。合适的k值选择是一个比较困难的问题。通常,用户需要选择若干k值实验,以确定最恰当的簇的数目。对类密集、类间区别明显的数据集聚类效果效果较好,缺点是对孤立点和噪声数据敏感,要事先指定类的数目,并且经常是局部优先。(2)ID3算法。ID3算法的基本策略是:从训练集的单个节点开始,若所以数据都在同一类,该节点成为树叶,否则,利用信息量的差异选择能将样本最好分类的属性(该属性作为节点的决策属性),在ID3算法中是选择具有最大信息增益的属性,该方法使得对一个对象分类所需的期望测试数目最小。该算法中,所以的属性都取离散值,若属性是连续值,则必须要进行离散化,对测试属性的每个已知值,创建一个分枝并依此划分样本,递归形成每个划分上的样本判定树。下列条件之一成立时算法终止:①给定节点的所有样本属于同一类。②没有其他属性可以用来进一步划分样本。此时,用多数表决,即用样本中多数所在的类标记,从而将节点转化为树叶。③某一分枝没有样本。此时,用样本中的多数类创建树叶。下面是ID3算法的步骤:步骤1:创建节点N步骤
本文标题:数据挖掘技术在网络自主学习平台中的应用(本科毕业论文)
链接地址:https://www.777doc.com/doc-2333543 .html