您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > IRT多级评分项目的参数估计及其在测验中的应用
IRT多级评分项目的参数估计及其在测验中的应用作者:杜文久,DuWenjiu作者单位:西南师范大学数学系,重庆,400715刊名:应用概率统计英文刊名:CHINESEJOURNALOFAPPLIEDPROBABILITYANDSTATISTICS年,卷(期):2000,16(4)被引用次数:0次参考文献(4条)1.茆诗松.王静龙数理统计19902.魏宗舒概率论与数理统计19833.RonaldK.Hambleton.HariharanSwaminathonItemResponseTheory-PrinciplesandApplications19854.谢盛荣正态变量和与最大值的渐近独立性1997相似文献(5条)1.期刊论文杜文久.DuWenjiu项目反应理论框架下多级评分项目的信息函数-心理学报2006,38(1)目的是给出多级评分项目的信息函数计算公式,同时通过几个实例讨论了多级评分项目信息函数在实践中的应用.主要取得了如下成果:(1)首先通过一个例子给出了测验项目的样本空间;(2)以二参数逻辑斯蒂模型为基础,讨论了几种多级评分项目的概率函数,并在此基础上给出了多级评分项目的信息函数计算公式;(3)通过几个实例讨论了多级评分项目信息函数在实践中的应用.2.学位论文周世科混合题型的IRT等值问题研究2008等值的研究对于考试的公平性、题库建设、教学质量评价和计算机自适应测验都具有重要的意义。在IRT框架下,常用的项目反应模型有0—1评分的Logistic模型和多级评分的等级反应模型(GradedResponseModel,GRM)或拓广的分部评分模型(GeneralizedPartialCreditModel,GPCM)。随着教育测验评价形式的不断丰富,越来越多的试卷不仅有0—1评分题,又有多级证分题,我们称这种试卷为混合题型试卷,简称为混合题型(MultipleItemType),我国也常常使用这种题型进行测试,例如医生资格考试。以往国内对混合题型的测验等值采用的方法是将Logistic模型看成是GRM或GPCM的特例。为确定起见,本文假设多级评分项目适合GRM。由于GRM中不含有猜测度,所以当0—1评分项目存在猜测时,这种处理方式就忽略了项目的猜测因素。为了解决这一问题,本文将三参数的逻辑斯蒂克模型和等级反应模型进行扩展得到混合模型,此模型解决了0—1评分项目猜测度被忽略的问题,并针对此模型开发了相应的等值程序。另外,为了检验某次测验0—1评分项目存在猜测,而人为将其忽略所带来的误差大小。本文给出了利用IRT特征曲线法求解等值系数的方法和具体步骤,以等值系数估计值的误差大小作为衡量标准,进行了大量的MonteCarlo模拟实验,使用相同的模拟数据将混合模型与GRM进行比较,其中GRM是忽略了0—1评分项目猜测度的。实验结果表明,若某测验中0—1评分项目存在猜测而等值时忽略这一事实误用GRM,在绝大部分情况下都比混合模型等值的误差大而且有显著性差异,并且等值的误差会随着猜测度的的增大而增大。最后,考虑到多级评分项目同样会存在猜测,本文还对IRT新模型—三参数等级反应模型进行了等值研究。分别用5种不同的等值准则考察三参数等级反应模型的有效性和适应性。结果表明,当等值系数A取值在0.5~1.4之间SLcrit表现更好,1.5~2.0之间Hcrit表现稍好,SQRcrit、Wcrit、SREcrit占优的情况不多,胜出的范围也没有规律。3.学位论文陈青三参数等级反应模型(3P-GRM)的建立及其应用研究2008项目反应理论(ItemResponseTheory,IRT)是现代教育心理测量领域中最有影响力的一种测量理论,它的一个明确目标是扩展模型的种类以至于能够处理实际测试中任何形式的反应数据,要实现这个目标,就需要对测验过程有更加深入的认识及明确项目属性和人的能力之间微妙的联系(vanderLindenetal.1997)。虽然模型不可能完全和实际测验吻合,但只有不停的改进和开发新模型,才能使他们之间的差距缩小,才能进一步的完善IRT。在已有的各种模型研究中,对于多级评分项目,只考虑到项目区分度和难度。但在实际测验中,此类项目还可能存在猜测度。所以本研究基于Samejima等级反应模型,将项目猜测度融合到多级评分模型中,提出了三参数等级反应模型(Three-parameterGradedResponseModel,3P-GRM)并围绕该模型做了以下工作:1.利用项目等级反应函数和信息量函数对三参数等级反应模型进行了描述,并将其与等级反应模型进行比较。此外,我们还证明了如果忽略项目的猜测度,会使能力估计的精度虚假的升高;2.基于MMLE/EM算法,开发了相应的项目参数估计程序,使用模拟数据和实测数据对程序进行了检验;3.编制了模型资料拟合检验程序以检验实测数据与该模型的拟合情况;4.探讨了如何用测验信息量控制试卷的质量。4.期刊论文第十六卷总目录-应用概率统计2001,17(1)学术论文一类隐函数及其在计量抽样检查中的应用汪仁官(1)带有不完全信息随机截尾试验下Weibull分布参数的MLE的相合性及渐近正态性杨纪龙叶尔骅(9)两个未知均值方差混合模型有限制下对数极大似然比的极限分布(英)成平(20)矩阵损失下一类相依回归模型中的线性容许估计和Minimax估计李新民徐兴忠秦前清(25)关于一般马氏过程遍历性的一个注记董召巩馥洲(31)一类相依回归方程限定两步估计的有限样本结果陈永明(36)基于负相协样本的经验过程的弱收敛(英)袁明苏淳(45)非时齐向量值马氏决策模型秦叔明张升(57)指数型产品失效率鉴定试验的Bayes方案张志华姜礼平(66)错误先验假定下回归系数Bayes估计的小样本性质韦来生(71)期权价格函数的局部多项式估计茆诗松刘忠(81)结构可靠性的精确置信下限郑忠国卜红军等(89)集值序上鞅的若干有关问题(英)汪荣明吴伟志(98)L-统计量的Edgeworth展开和Bootstrap逼近任哲陈明华(113)更新理论积分方程的解析解康志荣闫玉斌(125)随机变量的负超可加相依及其应用(英)胡太忠(133)增长曲线模型中向量函数的线性可容许性李俊海徐兴忠陈峥(145)超布朗运动关于区域的首中方式(英)唐加山赵学雷(152)有限混合模型有限制Log极大似然比统计量的极限分布(英)陈家骅成平(159)关于超过程的几个比较定理(英)张新生(168)椭球等高分布的逆问题胡端平(177)股票价格过程方差函数的统计推断肖庆宪郑祖康(182)系统风险Beta系数的非参数估计顾娟茆诗松(191)基于负相协样本经验过程的加权弱收敛(英)袁明苏淳(199)无RNPBanach空间中集值测度的Radon-Nikodym定理(英)吴伟志张文修(208)关于测验等值几个问题的研究陈希镇(213)回归函数的投影寻踪逼近的Lp收敛性田铮肖华勇(225)未知方向密度估计的收敛率(英)崔恒建(229)对数正态分布场合无失效的BAYES验证试验方案何基报茆诗松(239)受约束的组合投资模型研究—最终财富效用优化费为银(249)可变样本容量的质量控制图张维铭(255)污染数据回归分析中参数的最小一乘估计任哲陈明华(262)极限相对对数似然比与一类强偏差定理刘文(269)不完全椭球约束下多指标线性模型中的可容许线性估计杨国庆(277)倒向随机微分方程解的Malliavin微分林清泉(285)马氏环境中马氏链的Shannon-McMillan-Breiman定理方大凡(295)多元回归函数最大值点BRPA估计的相合性吴耀华王小明(299)有交易费时的欧式期权定价刘道百(303)一种多级评分模型及参数估计余军周纪芗(318)求参数置信限的一种方法孙万龙(337)IRT多级评分项目的参数估计及其在测验中的应用杜文久(350)SV模型下的期权定价和风险计量刘忠(365)Lagrange方法和期权定价李小军(373)截尾样本下回归函数改良核估计的强相合性胡玉萍薛留根(379)上海市老年护理互助会会员会费交付平衡研究吴贤毅王静龙(391)几种基于CAPM的最优投资组合构造方案及其比较何基报茆诗松(398)拟正则保正型过份函数的积分表示及h-结合过程的轨道性质陈传钟(409)非对称广义自回归条件异方差的新模型吴硕思方兆本(416)Hilbert-值半鞅序列的弱收敛(英)李亮坤彭运佳谢颖超(423)线性等值公式的误差估计陈希镇(435)应用简报肥胖教职工患心血管病情况的调查和分析徐进李桂枝(220)多元统计分析在棉铃虫分级预报中的应用丁世飞325)我国农作物受灾及成灾面积的综合预测分析陈平达庆利(329)用回归分析比较两图书馆流通书库工作量李小梅陆俊陈恒芬(333)学术活动报道第十二届全国多指标随机过程学术讨论会(223)江苏省概率统计分会学术活动报导(336)上海财经大学召开统计学专业素质教育研讨会(447)戴世光教授在京逝世(224)第十五卷总目录(109)ContentsofVol.16ArticlesAnImplicitFunctionsandItsApplicationsforVariablesSamplingInspectionsWangRenguan(1)ConsistencyandAsymptoticNormalityofMLEoftheParametersofWeibullDistributionforRandomCensoringModelwithIncompleteInformationYangJilongandYeErhua(9)TheLimitDistributionoftheRestrictedLogMaximumLikelihoodRatioforMixturcModelsofTwoNormalDistributionswithUnknownMeanandVarianceChengPing(20)TheLinearAdmissibleandMinimaxEstimatorsinSeeminglyUnrelatedRegressionModelunderMatrixLossLiXinmin,XuXingzhongandQinQianqing(25)ANoteforErgodicityofGeneralMarkovProcessesDongZhaoandGongFuzhou(31)SomeExactFiniteSampleResultsofEstimatorsBasedonRestrictedResidualsinAClassofSeeminglyUnrelatedRegressionsChenYongming(36)WeakConvergenceforEmpiricalProcessesofNegativelyAssociatedSequencesYuanMingandSuChun(45)ANon-stationaryDiscountedVector-valuedMarkovianDecisionModelwithUnboundedRewardQinShumingandZhangSheng(57)ABayesianPlanofTestingforProductionAcceptenceinExponentialCaseZhangZhihuaandJiangLiping(66)TheSmall-samplePropertiesfortheBayesEstimatorofRegressionCoefficientsunderMisspecifiedPriorAssumptionWeiLaisheng(71)LocalPolynominalEstimationofOption-tradingFunctionMaoShisongandLiuZhong(81)TheAccurateLowerConfidenceLimitfortheReliabilityofStructuralSystemZhengZhongguoandBuHongjune
本文标题:IRT多级评分项目的参数估计及其在测验中的应用
链接地址:https://www.777doc.com/doc-753545 .html