您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 项目反应理论及其应用现状分析(文献综述)
项目反应理论及其应用现状分析摘要项目反应理论作为对经典测试理论的继承和发展被提出,它代表了测量学领域新的发展方向。本文首先介绍了项目反应理论的基本概念、发展史,接着分析了相对于经典测试理论,项目反应理论的优点,然后归纳了项目反应理论的模型分类,最后指出了项目反应理论的应用热点以及在国内的发展前景。关键词:项目反应理论;应用热点一、引言经典测量理论(ClassicalTestTheory,简称CTT)与项目反应理论(ItemResponseTheory,简称IRT)是教育心理测量理论中的两大支柱。其中经典测试理论以弱假设为基础且操作简单、易于理解等优点在实践中得到了广泛运用,但其本身存在诸多不足之处,限制了它在实践中的应用,项目反应理论就是在这样的背景下发展起来的一种新的测试理论,它是对经典测试理论的继承和发展,它代表了测量学领域的新的发展方向。二、项目反应理论(一)项目反应理论的概念项目反应理论(IRT)也称潜在特质理论或潜在特质模型,是一种现代心理测量理论,它的重要意义在于,可以用于指导项目筛选和测验编制。项目反应理论假设认为,被试者存在一种“潜在特质”,“潜在特质”即:在进行观察分析测验反应中,被试对象的潜在能力,通常以测验总分作为这种潜力的估算。项目反应理论认为,被试对象在测验项目上的反应和成绩与他们的潜在特质有特殊的关系。由于项目反应理论建立的项目参数具有恒久性的特点,使得不同测量量表的分数可以统一。项目反应理论通过项目反应曲线综合各种项目分析的资料,使我们综合地、直观地看出项目难度、鉴别度等项目分析的特征,从而起到指导项目筛选、编制测验、比较分数等作用[1]。(二)项目反应理论的发展过程项目反应理论是二十世纪80年代测量学界研究的主题之一。项目反应理论以潜在特质理论为基础,以单个的测试项目为研究对象,以被试者的潜在心理特质和被试者在测试项目上的反应之间的关系作为自己的核心内容,同时用某种数学形式来表示。项目反应理论的这种基于项目的测试思想最早出现在比奈—西蒙编制的世界上第一个智力量表中。他们测试并分析了不同年龄的儿童对测试项目不同的反应情况,画出了正确反应水平之间与被试者年龄的散点图。只要用一条光滑的曲线对图中的散点拟合一下,就能得到一条项目反应曲线。因此,这一图形通常被认为是最早的项目反应曲线图。20世纪40年代,月一麦学者乔治·拉什(GeorgeRasch)最早提出了项目反应理论的概念。1946年Tucke,提出了项目特征曲线的概念。1952年和1953年洛德(Lord)提出了双参数正态拱形模型,同时洛德还提出了与此模型相关的参数估计方法,实际的二值计分的测试问题也可以用IRT来解决。这是项目反应理论IRT发展史上的重要里程碑,它标志着项目反应理论的正式诞生。但是,由于项目反应理论在数学上的复杂性以及缺乏有效的计算机程序的支撑,一直到60年代末,项目反应理论的发展始终都是十分缓慢的。直到20世纪70年代以后,由于计算机技术的快速发展,计算机技术广泛运用及普及,以及参数估计方法及相应计算机程序的出现,项目反应理论IRT才逐渐成为心理与教育测试理论的研究重点[2]。(三)项目反应理论的两大核心概念1.潜在特质理论潜在特质理论(LatentTraitTheory,简称LTT)是指制约人的行为的心理品质。由于这种特质至今没有任何迹象表明它的物质存在。因此,称为潜在特质(LatentTrait)。心理测量学家致力于从测量学的角度探清其结构和性质并使之数量化,然后希望能够测量个体在这些特质变量上的量值,以预测个体的行为。为达成这一目的,心理测量学家作以下定义:对于人的某种任务行为起制约作用的若干潜在特质的集合称为潜在特质空间,记为θ,其中相互独立的潜在特质的数目称为空间的维度。一个k维的潜在特质空间可表示为θ=(θ1,θ2,θ3,…,θk),其中θt(其中1≤t≤k)为一个潜在分量。2.项目特征曲线项目特征曲线(ItemCharacteristicCurve,ICC)是指被试在项目上正确作答概率对被试潜在特质水平的回归线。我们能从ICC看出反映项目属性的参数指标,如项目难度、项目区分度等。ICC以潜在特质θ为横坐标,以正确反应或肯定反应的概率P(θ)为纵坐标。项目难度值b即为正确反应概率P(θ)等于0.5时,所对应的潜在特质θ值,而项目区分度a则为曲线在拐点b处的切线斜率的函数,斜率越大项目区分度越高。(见图1)项目特征曲线的解析式称为项目特征函数(ItemCharacteristicFunctions,ICF),也即通常所说的项目反应理论的模型[3]。(四)项目反应理论相对经典测试理论的优点经典测试理论虽操作简单在实践中被广泛运用,但却存在难以克服的三大问题:1.样本依赖性(sample-dependent),由于选择样本的项目不同,试题项目参数如:信度、难度、区分度等都会有所不同;2.经典测试理论没有将试题的难度与学习者能力水平很好的相匹配,导致在学习者能力相差比较大的情况下误差很大,而这种结果通常不能为研究人员所接受;3.经典测试理论的测验信度是建立在平行测验假设的基础之上的,但严格平行的测验是不存在的。为了弥补经典测试理论中的不足,项目反应理论提出了“潜在特质”假设,认为被试者具有潜在能力之类的特质,在测试中对其进行估算,并将被试对单个测验项目的某种反应概率与此项目的一定特征联系起来。相对于经典测试理论,基于项目反应理论的测试具有以下五个特点:1.对被试能力参数估计的相对不变性,具有稳定性,且被试能力的估计不依赖于特定的测验题目;2.项目参数估测时保持一定的恒定性,不同的测验结果可直接比较;3.对被试能力的估测具有较高的精确性。测验信息函数的概念代替了信度理论,用测验对能力估计所提供的信息量的多少来表示测量的精度。这避免了平行测验的假定,因而其数据分析更为可靠;4.试卷编制更具价值性。基于项目反应理论的试卷编制,被试能力与项目难度都经过了严格匹配、筛选,并安排在同一个测量量表上,因此试卷编制、测试数据的分析、解释都更为容易,并且在鉴定项目的等值性、建设项目试题库、开展基于计算机的自适应测试(ComputerizedAdaptiveTestingCAT)等方面都具有更为开阔的情景;5.项目反应曲线直观形象,简单明了。由于IRT的项目反应曲线综合了多个项目分析的资料、信息,诸如项目难度、区分度等项目特征参数在一条拟合曲线上,因而也就能够在曲线上得到比较直观的说明[4]。(五)项目反应理论模型分类项目反应理论发展至今已有众多模型,形成了一个庞大的模型家族,学术界一般从“计分方式”,“参数个数”,“向量维度”和“累积模型(CumulativeMode1,CM)、展开模型(UnfoldingModel,UM)这四个角度对其进行分类。考虑到应用上的便利,按照所处理测验数据类型(计分方式)的不同,众多IRT模型做可做以下分类:1.二级评分IRT模型适用于测验项目采用二级评分的测验。主要有正态曲线(卵形)模型、逻辑斯蒂模型、最优量表模型(PerfectScaleModel,PSM)、潜在距离模型(LatentDistanceModel,LDM)。2.多级评分IRT模型用于对测验项目采用多级评分的测验。主要包括类别反应模型(NominalResponseMode1,NRM)、等级反应模型(GradedResponseMode1,GRM)等。3.连续型IRT模型主要用于对测验项目的评分是连续变量的测验[3]。(六)项目反应理论应用热点1.指导常模参照测验编制根据用户在每一个能力点上的测验精度要求,翻算“测验目标信息函数”,将选题组编测验的操作过程具体化为:“根据信息需求选题—计算信息量—充填目标信息函数—充填完毕满足要求”的过程。2.指导目标参照测验编制应用项目反应理论被试能力稳定不变的特点,在编制目标参照测验时,不同复份的合格分数线只要他的对应能力相等,就确认其合格标准是同一个。具体方法是,首先认定全体库作答分数合格比例,计算对应合格能力点,组卷,对每份测验都用下式在合格能力点上求其合格卷面分。3.指导大型高质量题库建设题库建设的关键是题库中每道试题都要有准确的参数。CTT难以做到是因为参数估计不独立于被试样本。IRT具有参数估计独立于被试样本的优点,因此IRT题库可以做到所有试题参数都在统一的量表系统上。IRT题库要做到这一点,要完成项目参数等值设计和等值转换。4.指导计算机化自适应测验编制计算机化自适应测验是一种因人而异的测验,编制关键在于有大型高质量题库、被试评价不依赖于测验文本和快速运算及时反馈。其中被试评价不依赖于测验文本目前只有项目反应理论指导的测验具备这一条件。项目反应理论的信息函数还可以帮助控制测验精度。5.指导理想点测验编制某些非认知测验中,被试的特质处于两端时都对试题做否定作答,只有被试特质与试题特质位置匹配时,被试才做肯定作答。这种测验被称为具有理想点反应过程的测验。其项目特征曲线不是单调递增的。如果使用传统测验模型(CTT模型和项目反应理论传统模型)指导测验编制,经项目分析会删除特质中等位置的题目,而仅保留特质两端的题目。测验将不能精确区分特质处于中等程度的被试。为此,项目反应理论发展了一种被称为展开模型的项目反应模型来指导这类测验编制。应用展开模型使得测验能保留特质处于中等位置的优秀题目,测验将能有效区分特质处于中等程度的被试。6.指导动态测验编制动态评估是一种关注个体未来发展水平的互动式测量模式。它通过教学和干预等把个体的学习过程和学习结果结合起来,考察个体的未来发展水平或学习潜能。与静态测验相比,动态评估可以提供更多的信息。传统的动态评估常用前、后测分数的差值来量化学习潜能的大小,而无法对两极端获益分数进行探讨;尤其是当前后测验不平行,项目难度存在差异时,更难以对评估结果进行解释;还由于经典测验理论对分数的解释基于样本分布,很难适应动态评估。为了解决这些问题,Emhretson等提出了用IRT模型作为动态评估的计量学模型,如学习和变化的多维Rasch模型(MRMLC)。7.应用多侧面Rasch模型分析测验质量多侧面Rasch模型具有类似概化理论分析测验质量、变化测验情景优选测验方案的功能。多面Ranch模型是包括用于各种测量情境的一系列模型。相比较于概化理论多侧面Ranch模型具有等距量尺;为检查测量情境中各个侧面提供了方法,并为调整侧面差异提供了理论框架,可提高测量结果的客观性和公平性;各参数具有充分统计量,便于参数估计,具有参数不变性,所有参数在同一量尺上;对含有缺失值的不完全设计可以进行较好处理;可以进行不同组的侧面功能差异分析;可以处理各个侧面之间的交互作用等优点[5]。三、结论IRT的应用热点中,在考试系统这一方面,根据项目反应理论所编制的自适应测验,效度好、信度高、使用灵活,具有更广阔的应用前景。但是,项目反应理论也存在着一些客观的问题,项目反应理论需要从事教育心理测量研究人员,具备很高的数理统计能力,甚至较为深厚的数学功底,同时,还必须借助电脑的辅助和统计软件的支持来解决繁琐的运算过程,这些客观因素限制了国内对IRT的推广应用。但是,随着计算机技术的快速发展,相信项目反应理论在国内的广泛应用还是指日可待的。四、参考文献[1]赵秋.项目反应理论的发展综述及其在教育测量学中的应用[D].东北师范大学,2008.[2]冯熠.基于项目反应理论的题库研究[D].南京师范大学,2014.[3]苏昭,刘燕.项目反应理论研究综述[J].江西科技学院学报,2013,02:45-48.[4]齐宇歆.基于PISA的学习素养评价系统设计[D].华东师范大学,2013.[5]戴海琦,罗照盛.项目反应理论原理与当前应用热点概览[J].心理学探新,2013,05:392-395.[6]杜洪飞.经典测量理论与项目反应理论的比较研究[J].社会心理科学,2006,06:15-17.[7]李晓铭.项目反应理论的模型[J].心理发展与教育,1989,02:27-32+58.[8]詹沛达,王文中,王立君.项目反应
本文标题:项目反应理论及其应用现状分析(文献综述)
链接地址:https://www.777doc.com/doc-5712559 .html