您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 基于Multi-Agent的自适应教学策略调整研究
基于Multi-Agent的自适应教学策略调整研究涂飞*张小真**西南师范大学计算机与信息科学学院*E-mail:fdtf@swnu.edu.cn**E-mail:zhangxz@swnu.edu.cn教学策略的调整是教学系统研究中的一个重要课题,是教学系统智能性的一种重要体现。本文分析了对教学策略研究的现状,针对其不足,构建了一个基于Multi-Agent的自适应教学策略调整模型,它能根据学习者的状态信息不断选择更加合适的教学策略或者对当前使用的策略进行“微调”,使之最大可能地适合学习者的状态和特性,达到好的学习效果。关键词:Agent教学策略自适应教学系统1引言网络教育的迅速发展,网络教学系统的广泛应用,对教学系统的“智能性”的需求越来越强烈。网络教学系统的智能性最重要体现在教学系统是否能够实现个别化的教学,针对不同的学生找到并采用最合适的教学方法.要实现这种“智能性”,如何针对不同的学生找到并采用最合适的教学策略并在学习过程中不断地调整是一个很重要的研究课题。一种教学策略不可能适合每一个人,甚至在同一个人学习的不同阶段也需要有不同的教学策略支持。我们拟通过多Agent的系统结构对学习者学习行为以及学习效果进行监控和分析进而选择合适的教学策略或对现有教学策略稍加修改实现自适应的教学策略调整。2教学策略应用、研究的现状及有关问题教学系统中教学策略调整的智能性体现在下面两点:(1)根据学生的认知模型提供的信息,通过智能系统的搜索与推理,动态生成适合于个别化教学的策略。(2)根据学习者的不同以及学习者在不同阶段的学习的不同自动选择最适合学习者的教学策略并不断调整。分析目前投入使用的教学系统,对教学策略的支持大体可分为下面几种形式:(1)整个教学系统采用一种已经制定好的教学策略,不分学习者是谁,不分学习者的学习能力的变化。这样的系统构造起来很简单但已经不能满足现代远程教育的需要(2)整个教学系统采用一种已经制定好的主教学策略,但教学策略的某些部分是可以由学习者自主进行选择的,学习者可以根据自己的需要进行选择。目前大多数远程教学系统都是如此。(3)系统提供多种教学策略,学生在学习前进行选择。可见目前的远程教学系统大都不具有教学策略的自适应调整功能。目前,国内外对教学策略的自适应调整也有一些研究如:蒙特利尔大学ClaudeFrasson等人的“行动者”模型;Jean-FrancoisMorin等人的教学代理模型;北师大电子系武法提提出的基于多Agent的远程教学系统等等。但是,这些模型及研究结果有的并没有给出完整的系统结构,有的还只是大致的结构,有的仅仅是对教学策略进行简单的选择并不能对教学策略自身进行调整。针对这些状况,我们主要在两个方面做工作:(1)如何在已有的教学策略找到最佳策略。(2)如果当前策略比较合适,如何对当前策略进行调整使之更加适合学习者的当前状况。3教学策略的构成首先我们给出学生在第i时刻的学习状态Ssi(StudyState)的形式化定义,学习状态用来记录学生的状态信息,它为选择适合学生的教学策略提供依据。SSi=(suit-η,enthusiasm,a-ability,quality,quantity,comprehend)suit-η用来衡量适合学生的教学策略难度enthusiasm用来衡量学生的学习投入程度;a-ability用来衡量学生运用知识的熟练程度;quality用来衡量学生掌握知识的牢固程度;quantity用来衡量学生掌握知识的广度。comprehend涌来衡量学生对知识的理解程度Ss中的各项可取用0到100的整数作值。教学系统的工作过程实际上就是对教学策略的执行,选择,调整过程。要实现我们的研究目的,我们还必须让教学策略的存储变得结构化,公式化。根据教育理论,教学策略可以看成是一系列的教学步骤或环节的综合。在此基础上,我们对教学策略进行一些扩充:每种教学策略可以根据它包含的教学步骤或环节划分为几个关键结点。结点与结点之间有一定的独立性,每个关键结点对应一个子组件包S-PGP(subpolicygroupwarepackage),包中包含了一系列后备结点。这些后备结点有相似性即都能独立完成这个教学步骤或环节,但每个后备结点在使用的教学资源的难容易程度,分量,表现形式等方面又各有不同。每个关键结点都应该是从它对应电脑后备结点中选择出来的。一种教学策略对应的所有S-PGP的集合称为一个PGP。同时每个结点或组件不仅仅包括一个教学步骤或环节而且包含了一些其他的属性(在后面有详细的定义)。一个完整的教学策略如图1所示。图1教学策略的构成教学策略可以形式化定义成如下形式:TP=(ID,G,type,η)其中,ID是教学策略的存储标号;type是该教学策略适用的教学内容的类型;η是对应的难度系数。G=(A1,A2,┅┅Am|A1∈S-PGP1,A2∈S-PGP2,┅Am∈S-PGPm),数列A是形成教学策略的一系列关键结点,每个关键结点代表一个教学步骤或教学环节。S-PGPi可定义为如下的形式:S-PGPi=(ai1,ai2┅aim)S-PGPi的集合即为PGP;ai是形成教学策略的一系列备用结点。数列ai中的各个元素应该是“相似”的,所谓“相似”是指在ai中任意选取一个元素都可以用来构造结点Ai,不会影响整个教学策略的完整性。ai可以定义为如下形式:ai=(teaching-step,property);property=(re1,re2,re3,re4,re5),re是权值,每个rei对应着SS中的元素(除suit-η外)如图2,re的大小反映了这个结点对SS中某个元素提高的强弱。如re1越大说明这个结点对学生的学生投入程度(enthusiasm)的改善越好。enthusiasma-abilityqualityaiquality教学策略PGPa11,a12,a13a14a21am1,am2,┅amkA1A2AmS-PGP1S-PGP2S-PGPm图2结点与SS中元素的相关性4自适应教学策略调整模型(AMTP)基于上述思想,我们设计了自适应教学策略调整模型AMTP(AdaptiveModelofTeachingPolicyAdjust)。它可以针对学生的学习状态动态地选择不同的教学策略,或对当前使用的策略进行微调。4.1AMTP模型的结构自适应教学策略调整模型AMTP结构如图3所示。图3AMTP模型结构图AMTP模型共包括一个教学策略库和五个agent组成,下面我们对这些模块进行说明。(1)TPD(TeachingPolicyDatabase):TPD中存储了所有的教学策略,按照我们前面对教学策略的定义,每一种教学策略在TPD中是按结点存储的。同时,对应于每种教学策略的PGP也存储在TPD中。(2)interfaceagent:负责与教学系统中的其他模块的通信。它的结构如图4三个部分组成,其中c-infomodule负责传送控制命令和控制信息;d-infomodule负责传送数据信息;ControlCenter用来协调另两个模块的工作。re1re2re3re4comprehendre5(3)watchingagent:监视学生的学习行为和学习效果并负责动态地修改学生的学习状态参数,由于篇幅的限制,这里我们不再讨论此Agent中使用的策略和算法。(4)studentagent:主要存放学习的的学习信息,如图5所示,可形式化定义如下:studentagent=(studentinfodata+studentinterfacemodule)studentinfodata=(all-SS+TP+PGP+studygrade)其中studygrade包含了学生的学习成绩的信息。all-SS=(SS1,SS2,SS3┅SSn),SSi(5)analysisagent:根据studentinfodata和分析算法对当前使用的教学策略进行分析和评价,判断是否应该更换教学策略还是对当前使用的教学策略进行微调。(6)adjustagent:根据选择算法选择最适合当前学生学习状况的教学策略并且把选择好的教学策略和它对应的PGP一并发送到studentagent中;或者对根据微调算法studentagent中的当前教学策略进行微调。4.2AMTP模型的工作流程watchingagent监视学生的学习行为并对学生进行测试根据监视的结果不断修改studentinfodata中的SS或者studygrade并发信息给Analysisagent告知它开始分析。Analysisagent收到watchingagent发来的信息后从studentagent中取出SS和studygrade并利用分析算法进行分析,若不需要调整教学策略则不做处理;若需要更换教学策略则给adjustagent发送控制信息info1;若只需要对当前使用的教学策略进行微调则发送控制信息info2。Adjustagent收到控制信息后进行判断,如果是ifo1则根据相关的策略选取教学策略并连同该教学策略所对应的PGP一并发送到studentagent中;如果是ifo2则直接在studentagent中找到当前使用的教学策略,并在对应的PGP中利用相关算法找到合适的备用结点对当前教学策略中的结点进行替换。AMTP模型的工作流程,基本实现了教学策略的自适应调整。5相关的算法5.1analysisagent中的分析算法H1analysisagent中的教学策略分析算法H1应该完成的任务是根据studentagent中的studentinfodata判断是应该采用新的教学策略还是应该对当前使用的教学策略进行“微调”或是仍然使用当前的教学策略studentInfodataStudentinter--facemodule图5studentagent的结构student图4Interfaceagent的结构c-infomoduled-infomoduleControlcenter不做改变。要实现这个功能我们先为当前使用的教学策略打分,再根据打分的结果进行判断。为此,我们先给出有关的定义。(1)策略得分:设策略得分为score,则score=(SS∪studygrade)*W(W是(SS∪studygrade)中的每一项元素对应的权重的集合)(2)完全过关标准:用ok1表示,是一整数型常量,当前教学策略若低于这个值则需要更换或微调。(3)策略得分增量:用incre表示,设score(j)是第j次的策略得分则nscorenscorenincreni11)()((4)增量过关标准:用ok2表示,是一整数型常量,当前教学策略若低于这个值则需要更换。教学策略分析算法H1描述如下:if(scoreok2)then教学策略不合适,必须更换新的教学策略elseif(ok2increok1)then教学策略基本合适,但还需要进行微调else当前教学策略已经是最佳策略,维持现状endifendif5.2adjustagent中的选择算法H2adjustagent中的教学策略选择算法H2应该完成的任务是在教学策略库中找到一种合适的教学策略。为此,给出如下相关定义:(1)结点可选度ε,教学策略的每一个结点都可以计算一个ε,若SS中每个系数的最大值都为x则ai结点的ε可以用下面的公式来计算ε=(x-enthusiasm)*ai.re1+(x-a-ability)*ai.re2+(x-quality)*ai.re3+(x-quantity)*ai.re4+(x-comprehend)*ai.re4(2)教学策略可选度Ω,一个有n个结点的教学策略,它的Ω可由如下公式计算nii1设教学策略库中有n种教学策略,则教学策略选择算法H2如下所示:①maxΩ=0,suit-ID=NUL②在教学策略库中选择一条未判断的教学策略③若η∈suit-η且该教学策略当前没有使用则④转到否则转到④计算该教学策略的Ω⑤如果ΩmaxΩ则maxΩ=Ω、suit-ID=该教学策
本文标题:基于Multi-Agent的自适应教学策略调整研究
链接地址:https://www.777doc.com/doc-822007 .html