您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 关联规则在课堂教学质量评价中的应用
1关联规则在课堂教学质量评价中的应用薛小锋摘要:课堂教学质量评价是教学管理过程中的重要环节,不断提高课堂教学质量评价数据的客观性和可靠性是提高教学评价质量的重要途径和手段。本文讨论了如何利用关联规则数据挖掘技术,对课堂教学质量评价数据进行关联规则挖掘,以提高教学评价的科学性、客观性和准确性。关键词:数据挖掘;关联规则;Apriori算法;教学质量评价中图分类号:TP311文献标识码:AUseofAssociationMininginClassroomTeachingEvaluationXUEXiaofengAbstract:Theevaluationofclassroomteachingqualityisanessentialpartforteachingmanagement.Raisingteachingevaluationdataobjectivityandcredibilityisasignificantmeansofimprovingteachingevaluationquality.Inthispaper,inordertoimprovethescientific,accuracyandobjectivityofteachingevaluation,itisdiscussedhowtoapplydataminingtechnologytoexploringassociationrulesofthedatainteachingevaluation.Keywords:DataMining,AssociationRule,AprioriAlgorithm,TeachingQualityEvaluation教学质量评价是教学管理过程中的重要环节,它是根据教学目标和教学原则的要求,制定科学的评价标准,系统地收集信息,对教与学活动的过程及其结果进行测量,并给予价值判断的过程[1]。课堂教学是教学工作的基本形式和核心环节,对提高教学质量起着决定性作用。由于教学质量评价中所涉及的内容定性的多,定量的少,只能给出定性的标准,并且标准弹性较大,加之评价者因对标准把握上存在偏差及主观原因,这就给教学质量评价工作带来了一定的难度。自从Agrawal等人在1993年提出AIS关联规则算法以来,关联规则一直是众多学者的研究热点。关联规则应用广泛,需要研究的问题很多,如何把现有的关联规则挖掘算法与实际问题紧密结合起来是关联规则挖掘问题的重要研究方向之一[2]。文中尝试将关联规则挖掘引入课堂教学质量评价中,主要以江苏技术师范学院教学质量评价系统中的部分教师数据和学生数据为基础以期发现一些有用的信息。1关联规则概念关联规则挖掘是发现大量数据中项集之间的有趣联系,决定哪些事情将一起发生。例如,在购买铁锤的顾客中,由70%的人同时购买了铁钉。这些关联规则很由价值,商场管理人员可以根据这些关联规则更好地规划商场,如把铁锤和铁钉这样的商品摆放在一起,从而促进销售。1.1基本概念设I={i1,i2,⋯,im}为数据项集合,D为与任务相关的数据集合,也就是一个交易数据库,其中每个交易T是一个数据项子集,即T⊆I;每个交易数据均包含一个识别编号TID。设A为一个数据项集合,当且仅当A⊆I,称交易T包含A。一个关联规则就是具有A⇒B形式的蕴涵式,其中有A⊆I,B⊆I且A∩B=Φ,规则A⇒B在交易数据库中成立且具有s支持度和c置信度,这就意味着数据集D中有s比例的交易T包含A∪B数据项;且交易数据D中有c比例的交易T满足“包含A就包含B”。具体描述是:support(A⇒B)=P(A∪B),2confidence(A⇒B)=P(B|A),满足最小支持度阀值(min_sup)和最小置信度阀值(min_conf)的关联规则称为强规则。这两个阀值均在0%~100%之间。1.2关联规则挖掘的步骤关联规则挖掘的任务就是在事务数据库D中找出具有用户给定的最小支持度和最小置信度的强关联规则。强关联规则X⇒Y对应的项集X∪Y必定是频繁项集,而频繁项集X∪Y导出的关联规则X⇒Y的置信度又可由频繁项集X和X∪Y的支持率计算。于是,可以将关联规则挖掘分解为以下两个步骤:步骤一:根据最小支持度找出D中所有的频繁项集。步骤二:根据频繁项目集和最小置信度产生强关联规则。在上述两个步骤中,步骤一的任务是迅速高效地找出D中全部的频繁项集,关联规则挖掘的整体性能由该步骤决定。因此,目前所有的关联规则挖掘算法都集中在步骤一的研究上。步骤二是比较容易实现的,首先对于每个频繁项集l,产生l的所有非空子集。然后对于每个l的非空子集s,如果sup_()min_sup()countlconfcounts≥−,则输出规则“s⇒(l-s)”。综上所述,关联规则的基本模型可用图1表示,其中D代表事务数据库,Algorithm-1为频繁项目集的搜索算法,Algorithm-2为关联规则的产生算法,R为挖掘出的关联规则集合。用户通过指定最小支持度阈值和最小置信度阈值分别与算法Algorithm-1和Algorithm-2交互,并通过与R交互,对挖掘结果进行解释和评估。图1关联规则挖掘模型1.3改进的Apriori算法Apriori算法在执行“连接-剪枝”的迭代过程中,需要多次扫描数据库,如果生成的频繁项集中含有10-项集,则需要扫描10遍数据库,增大了I/O负载。并且迭代过程中,候选项目集Ck是以指数速度增长的,Lk-1自连接会产生大量的候选k-项目集,例如有104个1-项集,自连接后就可以产生大约107个候选2-项集。这些都严重影响了Apriori算法的效率[3]。Apriori算法在迭代过程中多次扫描数据库和产生大量的候选项目集形成了算法的性能瓶颈。为了提高算法的效率本文进行如下改进:数据库D中每个交易T都有一个唯一的编号TID。定义K-项集Rk=Xk,TIDS(Xk),其中Xk=(ij1,ij2,…,ijk),ij1,ij2,…,ijk∈I,j1j2…jk,TIDS(Xk)是数据库中所有包含Xk的交易T的编号TID的集合,即为:TIDS(Xk)={TID:Xk⊆T,TID,T∈D}。根据上面的定DRAlgorithm-1Algorithm-2min_supmin_con用户3义k-项目集Rk的支持度可以表示为:support(Rk)=|TIDS(Xk)|/|D|=|{TID:Xk⊆T,TID,T∈D}|/|D|。Rk的支持数supNum(Rk)=support(Rk)*|D|=|TIDS(Xk)|。L’k表示k-项集的集合。改进的Apriori算法依然采用“逐层搜索”的迭代方法,迭代过程的“连接-剪枝”运算定义如下:1.连接:设两个(k-1)-项集:L’k-1(i)=Xk-1,TIDS(Xk-1)∈L’k-1,L’k-1(j)=Yk-1,TIDS(Yk-1)∈L’k-1,ij。如果Xk-1和Yk-1的前k-2项相等,即:Xk-1[k-2]≡Yk-1[k-2],则(k-1)-项集连接:L’k-1(i)∞L’k-1(j)=Xk-1∪Yk-1,TIDS(Xk-1)∩TIDS(Yk-1)=Xk,TIDS(Xk)=Rk∈L’k;否则,不进行连接运算,因为产生的结果不是重复,就是非频繁项目集,这样可减少计算量。2.剪枝:计算k-项集的支持数,根据上面的定义supNum(Rk)=|TIDS(Xk)|,该计算过程不需要再扫描数据库,避免了I/O操作,提高了算法的效率。如果supNum(Rk)≥minSupNum,则Xk,|TIDS(Xk)|∈L;否则,从集合L’k中删除Rk。改进的Apriori算法描述如下:输入:数据库D,最小支持数minSupNum输出:D中的频繁项目集L算法描述:1)L’1=findFrequentOneItemSets(D);//扫描数据库D生成1-项集的集合L’1。2)foreachOneItemSetX1,TIDS(X1)∈L’1//生成频繁1-项集的集合if(|TIDS(X1)|≥minSupNum)L=L∪{X1,|TIDS(X1)|};elseL’1=L’1-{X1,TIDS(X1)};3)for(k=2;L’k-1≠Ф;k++)L’k=L’k-1∞L’k-1;Foreachk_ItemSetXk,TIDS(Xk)∈L’kif(|TIDS(Xk)|≥minSupNum)L=L∪{Xk,|TIDS(Xk)|};elseL’k=L’k-{Xk,TIDS(Xk)};4)returnL;2关联规则的应用在数据挖掘之前,首先需要进行数据的聚焦。数据挖掘通常只涉及数据库的一部分,选择相关的数据集将使得挖掘更有效[4]。在课堂教学评价数据记入数据库之后,系统将汇集与挖掘任务相关的数据,并将这些数据插入到初始关系表中,初始关系表中记录的是与挖掘任务相关的数据,本应用数据主要分布在教师得分表、教师基本信息表、教师职称表中。在江苏技术师范学院学生评教数据库中,评价内容共分10项,每项满分为10分,可供选择的另有8分、6分及4分,计算总分后填入教师得分表的得分字段中,具体的评价方法参见表1。2.1数据准备随机从教学评价数据库中抽取教师教学质量评估数据200份,将年龄、职称和评定分数三项输入数据库,忽略其它信息。我们将通过数据挖掘找出年龄、职称和评定分数之间的关4系。表2给出了部分教学评价信息,共有200条记录。表1课堂教学评价表序号评价内容1教学态度认真,治学严谨,为人师表2讲课内容结构体系好,设计新颖,信息量大3注意提示本门课程的学习方法或研究方法4讲课思路清晰,表达准确,重点突出,理论联系实际5教学方法灵活多样,能激发对本课程的学习兴趣,启发学生思考6根据课程实际,合理采用现代化教学手段,讲课形象生动,教学效果好7注意学生实践和创新能力培养,重视本课程相关技能训练8能认真布置和批改作业9能经常到班辅导,耐心解答学生问题10不擅自停、调课,不上课迟到,不提前下课表2教学评价信息编号年龄职称评定分数1000130中级831000539副高851001928初级801005555正高921009838副高901010829中级85…2.2数据预处理表2中年龄、评定分数是数量属性,将它转换成布尔类型[5]。为了离散化,对年龄进行分组:年龄分为:A1[22,30],A2[31,35],A3[36,49],A4[50,60]四个组。评定分数分为:D1[90,100],D2[80,89],D3[65,79],D4[0,64]四个组。职称是类别属性,须进一步化为布尔类型。根据实际情况,职称的范围作了限定,职称分为:J1初级,J2中级,J3副高,J4正高[35]。转换后的部分数据如表3所示。表3转换后的数据A1A2A3A4J1J2J3J4D1D2D3D4100010000100010010000100000100011000001000101000100001000100010000101000…2.3数据挖掘下面我们分析一下教学人员的年龄、职称和评定分数的关联关系。评定分数∈[90,100]时,表示课堂效果较好,利用前面的挖掘技术,通过关联规则算法,挖掘一下具有较好课堂效果的教师的状态特征。首先,搜索原始数据库,得到评定分数=90的记录共50条。设min_sup=3%,min_conf=15%,经过挖掘,可以得到初步的关联规则如表4所示。规则A、B、D、E表明年龄在31~49岁,职称为中级以上的教师评价分数=90的可信5度要高。表4初步关联规则规则年龄职称置信度(%)支持度(%)A31~35358B36~49379C50~60123D中级3810E副高4515F高级2363结束语从课堂教学评价数据中找出数据间的关系,是检查教学效果和提高教学质量的有效途径,本文讨论了关联规则挖掘在教学质量评价系统中的应用研究,通过实验结果可以发现,在高校教学中,教师的年龄和职称对评价得分的影响较大。参考文献:[1]魏红.我国高校教师教学评价发展的回顾与展望[J].高
本文标题:关联规则在课堂教学质量评价中的应用
链接地址:https://www.777doc.com/doc-432574 .html