您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第四章教育测量的质量指标1(信度).
第三章教育测量与评价的质量特性信度·效度·难度·区分度主要内容教育测量与评价的信度教育测量与评价的效度教育测量与评价中题目(项目)的难度教育测量与评价中题目(项目)的区分度第一节信度一、信度的意义二、信度的统计定义三、信度系数的类型与估计方法四、提高信度的方法一、信度的意义信度(reliability)测量结果的稳定性和可靠的程度是对测验工具及其操作的整体质量的一中量度,是测验性能的重要质量指标。记为rxx一、信度的意义1.信度是任何一种测量的必要条件。因为教育测量的对象主要是精神现象,所测量的特性不易把握,为了能真实地反应测验对象的某种特点,需要更加注意测量的信度,从而正确地判断测量结果的价值。2.信度高的教育测量,能给教师和教育工作的领导者提供可靠的信息,为他们的教育预测和决策提供依据。3.信度高的教育测量,能使教师对学生的评价变得客观和可靠,也使学生对自己的认识更符合实际情况,从而有助于改进教与学的方法。4.信度高的教育测量,有助于提高教师的工作效率。一、信度的统计定义x=T+E(公式1-1)(X:观察分数,T:真分数(未知的,可将多次测量的实测值的平均值作为真值的近似值),E:误差)1、试比较以下两次测量结果(只进行一次)的信度:用尺子量100cm高的一个儿童,得到1cm的绝对误差;量185cm高的一位运动员,也得得到1cm的绝对误差。1、试比较以下两次测量结果(只进行一次)的信度:用尺子量100cm高的一个儿童,得到1cm的绝对误差;量185cm高的一位运动员,也得得到1cm的绝对误差。要比较两种测量结果的信度,一定要看误差分数(E)对于真分数(T)所占的百分数是多少。相对误差=E/T×100%公式(1-3最大绝对误差=E/x×100%公式(1-4)相对误差(甲)=1/100×100%=1%相对误差(乙)=1/185×100%=0.54%据此,度量乙的信度要比度量甲的信度高。怎样估计对一组人或一个人测量多次的实测值与真值(真分数)的差异程度呢?判别两组数据谁好谁差,不能只靠对平均数的统计和比较,关键是确定这两组数据偏离各自的平均数的大小。为了消除数据容量的影响,我们借鉴研究加权平均数的方法,选用各个偏差的平方的平均数,来描述一组数据偏离其平均数的大小,这就是方差。根据假设,观察分数的方差应等于真分数的方差加上测量误差的方差。即:公式(1-4)2E2T2xσσσ根据公式(1-4)可以给出信度的统计定义:第一,信度是一个被测团体的真分数方差与观察分数方差之比,即:公式(1-5)公式(1-6)可见,测验的信度一般在[0,1],越接近1,考试的信度越高。2x2E2x2E2xxxσσ1σσσr22xTxxr例:对5个人的某种智力因素的测验结果如表1-1,试估计测量的信度。表1-1测量5个学生的某种分数学生真分数误差分数实得分数A18-216B9+110C15+217D21+122E12-210学生真分数误差分数实得分数A18-216B9+110C15+217D21+122E12-210平均数15015方差182.820.8并列入表内。和σ、σ分别计算σ的方差公式,N)x(x(1)按σ2x2E2T22=0.86520.82.8=1-σσ1- r7)代入公式(1若不知真分数方差,则=0.86520.818=σσ6)r 代入(17)计算r6)或(1(2)代入公式(12x2Exx2x2Txxxx第二,信度是一个被试团体的真分数与观察分数的相关系数的平方。TXrxx2第三,信度是一个被试团体在测试X(A卷)上的观察分数与在测验X的任意一个“平行测验”X`(B卷)上的观察分数的相关系数。’XXrxx三、信度系数的类型与估计方法(一)稳定性系数(二)等值性系数(三)内部一致性系数(四)论文式测验的信度系数(五)评分者信度(一)稳定性系数(coefficientofstability)又称重测信度,是指用同一量表对相同被试者(一组人)在不同时间测验两次的实得分数的相关系数。估计稳定性系数的基本程序:测验A1适当时距测验A2(一)稳定性系数相关系数可以用不同方法计算,这取决于数据的性质。最为普遍的是皮尔逊积差相关系数:)10-1(])([])([222221公式YYNXXNYxXYNrAAX为第一次测验的实得分数;Y为第一次测验的实得分数;N为应试者数.(一)稳定性系数用一个算术四则的速度测验12个小学生,得分记为X,为了考察测量结果的可靠性,于3个月后再测一次,得分记为Y,问测验结果是否可靠?序号123456789101112X202021222323232425262627Y202121202323252526262729A1A2X2Y2XYXY010203040506070809101112202021222323232425262627202121202323252526262729400400441484529529529576625676676729400441441400529529625625676676729841400420441440529529625625650676702783ΣX=280ΣY=286ΣX2=6594ΣY2=6912ΣXY=6420286691212280659412[286280642012])([])([22222221YYNXXNYxXYNrAA解:(1)把资料列表于后,计算出公式(1-10)所需的各种统计量:ΣX=280ΣY=286ΣX2=6594ΣY2=6912ΣXY=6420(2)把所计算的统计量代入公式(1-10):采用重测法计算稳定系数时,要注意的问题:1、两次测验之间的时间间隔要适宜,尽可能在较短的时距内进行。2、两次测验试卷要等值,即在内容范围、题型、题数、难度、区分度等方面要基本相同。3、确定两测验是否等值,还要考察两次测绘结果的平均数与标准差。4、重测法适用于导质性测验,适用于速度测验而不适用于难度测验。5、测试应注意提高被试者的积极性。(二)等值性系数(coefficientofequivalence)又名复本信度(alternate-formsreliability):是以两个等值(题型题数、难度、区分度相等)但具体内容不同的量表,在最短时距内,对相同应试者先后施测两次所获得的两组对应分数的相关系数。其模式是:11AB测验测验适当时距(二)等值性系数(coefficientofequivalence)以A、B两型英语复本测验对初中三年级10个学生施测,为避免由测验施测顺序所造成的误差,其中5个学生先做A型测验,休息15分钟后,再做B型测验;而另5个学生先做B型测验,休息15分钟后,再做A型测验。10个学生A型测验结果记为X,B型测验结果记为Y,其测验的复本信度如何?学生序号12345678910X19191817161515141312Y20171818171513151212(二)等值性系数(coefficientofequivalence)优点:1、测验的两个复本,如果在不同的时间使用,其信度既可以反映在不同时间的稳定性,又可以反映对于不同测题的一致性;2、两个复本在同时使用时,可以避免再测信息的一些缺点,如首测时再测在记忆、练习、效果的影响,间隔期间获得新知识的影响,两次施测的环境不同和被试主观状态不同的影响,以及为了应付测验所作训练的影响等。(二)等值性系数(coefficientofequivalence)缺点:1、编制两个完全相等的测验是很困难的,如果两个复本过分相似,则变成再测形式,而过分不相似,又使等值的条件不存在;2、两个复本测验有可能在某种程度上测量了不同的性质,这就会低估测验的信度;3、被试同时接受性质相似的两个测验,可能减少完成测验的积极性;4、虽然两个复本测验的题目材料不同,但被试一旦掌握了解题的某一模式,就能触类旁通,有可能失去复本的意义。(三)内部一致性系数(internalconstancy)又叫同质性信度(homogeneityreliability)。是同一测验量表的两个部分(例如分为奇数题和偶数题,或者量表的前一半和后一半)得分的相关系数。估计方法有两种:1、分半法(Split-halfmethod):是将一次测验分成两个假定相等而独立的两部分来记分。通常是以题目的奇数为一组,偶数为一组,计算两级的相关系数,最后用斯皮尔曼-布朗公式校正,求得整个测验的信度系数。斯皮尔曼-布朗公式为:) 公式(11112xyxyttrrrrxy为两组测验分数的相关系数,rtt表示整个测验的信度系数。问题:为什么不直接用奇数题总分与偶数题的部分计算出的相关系数作为整个测验的信度系数而要加以校正?这是因为测验的长度(指量表中所包含的题目数)对信度的大小有一定的影响,测验越长,信度越高。而用分半法,实际上等于把整个测验长度减小了一半,所以按分成两半的资料求出的信度必然低于整个测验的信度。例:有一个由100题构成的量表施行于10个高三学生(分数见下表)。测验一次后,应试者即毕业离校。现在怎样评价测验结果的信度?得分被试奇数题总分偶数题总分XY010203040506070809103837384140363839403537373639393438393936方法:分半法得分被试奇数题总分偶数题总分X2Y2XYXY010203040506070809103837384140363839403537373639393438393936144413691444168116001296144415211600122513691269129615211521115614441521152112961406136913681599156012241444152115601260ΣX=382ΣY=374ΣX2=14624ΣY2=14014ΣXY=14311解:把有关统计量代入公式(1-10),求相关系数84.0)3741401410)(3821462410(374382143111022xyr用斯皮尔曼-布朗公式校正,91.084.0184.0212 xyxyttrrr经校正后的信度系数很大(0.91),说明整个测验的信度高。2、库德尔-理查森公式法(KuderRichardsonreliability)用此法只需测验一次,然后以各个问题的正确反应数为基础(此可视为各题难度的信息),或根据各人总分的平均数和标准差,计算信度系数。此公式有几个,其中常用的有rKR20和rKR21。(1)rKR20的用法:这个公式以每题能正确回答的人数占总人数的百分数为基础计算(每题只有通过或未通过两种分数)。例:有一种包含6个问题的测验,10个应试者得分如下表(答对得1分,答错得0分),试估计应试者反应的一致性程度。和的方差。为各应试者各题得分之Sp),1总人数的百分数( q各题错误反应的人数占q为数占总人数的百分数,p为各题正确反应的人,系数,K为测验题目数为整个测验结果的信度r12)) 公式(1Spq(11KKr2KR202KR20题得目被试分123456ΣZ0010020030040050060070080090101000001100100200001121110003010011311100031111004111100411011151101115ΣXpqpq8755440.80.70.50.50.40.40.20.30.50.50.60.60.160.210.250.250.240.24Σpq=1.35解:1)列出得分矩阵,计算有关统计量:40.039.001.235.11166121201.2103.353.323.31S3.31063221X35.1
本文标题:第四章教育测量的质量指标1(信度).
链接地址:https://www.777doc.com/doc-2093221 .html