您好,欢迎访问三七文档
第三讲测量信度本讲内容:什么是信度信度的估计方法有哪些怎样提高测量信度信度的作用有哪些第一节信度概述一、什么是信度理论:信度指的是测量结果的稳定程度。也就是若能用同一测量工具反复测量某人的同一种潜在特质,则其多次测量的结果之间的一致性程度就叫信度。信度有时也叫测量的可靠性。操作:1、信度乃是一个被测团体的真分数的变异数与实得分数的变异数之比,即:rxx=S2T/S2X2、信度是一个被试团体的真分数与实得分数的相关系数TX的平方,即:rxx=2TX3、信度乃是一个测验与它的任意一个平行测验的相关系数XX,即:rxx=XX二、信度的指标(一)信度系数:大部分情况下,信度是信度系数为指标,它是一种相关系数。理论上说就是真分数方差与实得分数的方差的比值,公式是:rxx=ptx2(二)信度指数:是真分数标准差与实得分数的标准差的比值,公式是:信度指数的平方就是信度系数rxx=ST2/SX2(三)标准误:指出个人测验分数的变异量。信度系数表示一组测量的实得分数与真分数的符合程度,标准误表示个人测验分数的变异量。用一组被试两次测量结果来代替同一个人反复实测,有了信度的另一个指标:测量标准误。测量的标准误与信度之间呈反比关系:标准误越小,信度越高;标准误越大,信度越低。二、信度的作用1、信度是测量过程中所存在随机误差大小的反映。(CCT的数学模型:X=T+E与rxx=S2T/S2X)2、信度可以用来解释个人测验分数的意义。SE=SX√1-rxx(X-1.96SE)=T=(X+1.96SE)3、信度可以帮助进行不同测验分数的比较。SEd=√SE12+SE22SEd=S√2-rxx-ryy实得分数(X)真实分数(T)SEX在T上的回归包括68%实得分数的全距第二节信度的估计方法一、重测信度1.含义和计算重测信度指的是用同一个量表对同一组被试施测两次所得结果的一致性程度。其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。当信度值较大,说明前后两次测量的结果比较一致,测量工具比较稳定,被试的潜在特质受被试状态和环境变化的影响较小。12121222221122/()/()/ttxxxxxxnrrxxnxxnrx1x2相关系数X1、X2同一被试的前测和再测的分数n样本例数212121SSXXNXXrxx2.使用的前提条件(1)所测量的潜在特质必须是稳定的。(2)遗忘和练习的效果基本抵消。(3)在两次施测期间,被试在所要测查的心理特质方面要求没有获得更多的学习和训练。3.注意之处:在报告重测信度时,应说明两次施测的间隔,以及在此期间内被试的有关经历。4、时间间隔的把握间隔时间越长,稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。几分钟至几年。年幼儿童,间隔要小;年长群体,间隔可大。智力测验的间隔不能太短,成就测验的间隔不能太长。一般间隔时间不超过六个月。(即不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘)第1次成绩:86587964914855823275第2次成绩:83528978856847762556计算公式:计算两组的总和:∑X1=670,∑X2=659计算两组的平方和:∑X21=48080,∑X22=47193计算两次成绩的积和:∑X1X2∑X1X2=86×83+58×52+79×89+64×78+91×85+48×68+55×47+82×76+32×25+75×56=46993样本例数:n=10计算相关系数相关系数的统计学意义判断确定自由度(df):df=n-2查表:上例df=10-2=8,r0.05(8)=0.632、r0.01(8)=0.765判断:r=0.819∵r>0.765∴p<0.01122246993670*659/100.8248080670/1047193659/10ttxxrr第1次成绩:86587964914855823275第2次成绩:83528978856847762556计算公式:计算两组平均值:X1=67X2=65.9计算两组标准差:S1=17.86S2=19.40计算两次成绩的积和:∑X1X2∑X1X2=86×83+58×52+79×89+64×78+91×85+48×68+55×47+82×76+32×25+75×56=46993样本例数:N=10计算相关系数相关系数的统计学意义判断确定自由度(df):df=N-2查表:上例df=10-2=8,r0.05(8)=0.632、r0.01(8)=0.765判断:r=0.819∵r>0.765∴p<0.01212121SSXXNXXrxx820.05.34628440.1986.179.650.671046993xxr5、优缺点:优点:(1)它最符合重复测验的涵义,是重复测验最简单最明确的方式(2)首测和再测只需要一套测验题目,省时、省力(3)同一套题目无论施测几次,所测的属性是完全相同的。缺点:(1)同一组被试对同一个测验先后两次作答相互之间是不独立的。(2)如果两次施测时间间隔较长,在此期间被试的身心发展,新知识的获得,都会使两次测验结果不相同。(3)同一个被试对现一个测验先后两次作答,对测验的兴趣不同,影响测验结果。(4)两次施测的环境不同,也是产生测量误差的因素。一、复本信度1.含义和计算复本信度指的是两个互相平行的测验测量同一组被试所得结果的一致性程度。其大小等于同一组被试在两平行测验上所得分数的皮尔逊积差相关系数212121SSXXNXXrxx复本等值要符合下列条件:各份测验测量的是同一种心理特性。各份测验具有相同的内容和形式。各份测验的题目不应重复。各份测验题目数量相等,难度和区分度大体相同。各份测验的分数分布(平均数和标准差)大致相等。复本编好后,应再测一次,以确保各份测验的等值。区分:等值性系数和稳定性—等值性系数图示稳定性系数:T1——t——T1等值性系数:T1————T2稳定性—等值性系数:T1——t——T2稳定性系数:即重测信度。等值性系数:如果两个复本测验是同时连续施测的,则称这种复本信度为等值性系数。稳定性—等值性系数:如果两个复本测验是相距一段时间分两次施测,则称这种信度为稳定性与等值性系数。2.使用的前提条件(1)首先必须构造出两份以上的平行测验复本。(2)被试有条件接受两个测验。(3)迁移效应对测量结果影响不大。3.注意之处:对于稳定性与等值性系数,在报告结果时,也应报告两次施测的间隔,以及在此间隔内被试的有关经历。4、优缺点:优点:(1)一个测验的复本使得测验数目的增加,对于所欲测量的属性相联系的行为总体代表性强,因此,一个测验的两个复本在两三天至一周对同一组被试施测时,获得的复本信度系数是相当准确的。(2)测验的两个复本,如果在不同时间使用,其信度不仅可以反映在不同时间的稳定性,而且还可以反映对于不同测题的一致性。(3)两个复本在同时使用时,可以避免再测验信度的缺点。缺点:(1)编制两个完全相等的测验是很困难的,(2)复本法只能减少而不能完全排除练习和记忆的影响。(3)被试同时接受性质相似的两个测验可能减少完成测验的积极性。5、适用范围(1)如果两个复本的施测相隔一段时间,则称稳定与等值系数。稳定与等值系数既考虑了测验在时间上的稳定性,也考虑了不同题目样本反应的一致性,因而是更为严格的信度考察方法,也是应用较为广泛的方法。(2)在实际应用时,为了抵消施测顺序的效应,应该有半数的被试先作A本再作B本,另一半被试先作B本再作A本。(3)复本测验不仅适用于难度测验,也是估计速度测验信度的最好方法。一、分半信度1.含义和计算分半信度,又叫内部一致性系数,指的是将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。其大小等于同一组被试在两半测验上所得分数的皮尔逊积差相关系数的校正值。斯皮尔曼——布朗公式:21hhtthhrrrrhh为两半分数的相关系数rtt为校正后(原测验长度时)信度的估计值2.使用的前提条件•只能施测一次或没有相应复本。•一个测验能够被分成对等的两半。3.注意事项:计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。由于分半信度实际上只是半个测验的信度,测验越长、项目越多,两半分数的相关就越高。因此,对长度不同的测验,要用校正公式。举例:10名被试者在一个有10个条目的测验中得分如下,求该测验的分半信度?485555631846双号得分16100112112210250333691115131718合计27000112222291601011022228-14000011212271701111221226-21000000102150100000010014-17111121222230400100121122171001221222110987654321单双之差单号得分测验题目得分被试485555631846双号得分16100112112210250333691115131718合计27000112222291601011022228-14000011212271701111221226-21000000102150100000010014-17111121222230400100121122171001221222110987654321单双之差单号得分测验题目得分被试0.510501NXXi8.410482NXXi28.22.51052)(21NXXSai78.116.31031)(22NXXSbi862.078.128.28.40.510275212121SSXXNXXrxx判断相关(查表)计算校正分半信度220.8620.926110.862hhtthhrrr其它计算分半信度方法斯皮尔曼–布朗校正分半信度的公式假设两半测验分数的变异相等,如实际情况不符合这一假设,应采用下列公式计算。弗拉南根(Flanagan)公式2222(1)abtttSSrSSa2和Sb2分别表示两半测验分数的方差St2为测验总分的方差举例(仍用上例)计算Sa2=[(7-5)2+(4-5)2+(7-5)2+(1-5)2+(1-5)2+(7-5)2+(4-5)2+(6-5)2+(7-5)2+(6-5)2]/10=5.2计算Sb2=[(6-4.8)2+(4-4.8)2+(8-4.8)2+(1-4.8)2+(6-4.8)2+(6-4.8)2+(5-4.8)2+(5-4.8)2+(5-4.8)2+(5-4.8)2]/10=3.16计算Sx2=[(13-9.8)2+(8-9.8)2+(15-9.8)2+(2-9.8)2+(4-9.8)2+(13-9.8)2+(9-9.8)2+(11-9.8)2+(12-9.8)2+(11-9.8)2]/10=15.36912.0)36.1516.32.51(2xxr卢伦(Kulon)公式221dtttSrSSd2表示两半测验分数之差的方差St2表示测验总分的方差举例(仍用上例)计算单双号差值(d)计算∑d=1计算d=∑d/N=1/10=0.2计算Sd2=[(1-0.2)2+(0-0.2)2+(-1-0.2)2+(0-0.2)2+(-2-0.2)2+(1-0.2)2+(-1-0.2)2+(1-0.2)2+(2-0.2)2+(1-0.2)2/10]=1.361.3610.91115.36ttr一、同质性信度1.含义和计算同质性信度指的是测验内部所有题目间的一致性程度。其一:所有题目都测量的是同一潜在特质,其二:所有题目得分之间都具有较高的正相关。值得注意的是,一些表面上看起来是测量同一种心理特质的题目,如果其题目间不具有较高的正相关,则不能认为它们具有同质性。我们讨论同质性信度的目的就在于判断一个
本文标题:第三讲测量的信度
链接地址:https://www.777doc.com/doc-6720487 .html