北师大考博笔记：心理学研究方法(3)：心理测量

第三部分心理测量一、什么是测量，有哪两个基本要素？有哪四种量表类型？和物理测量相比，心理测量有何特殊性？心理测验和心理测验的区别？编制一个心理测验应该具备那四个基本条件？（一）测量：参数按照一定的规则和客观的标准用量具对事物的特征进行定量描述的过程，它的基本要素是参照点（绝对参照点和相对参照点）和单位（确定的意义+相等的价值）。（二）量表的类型：1.称名量表：最低水平，只用数字代表分类，没有任何数量的意义。统计方法有百分比、次数、众数和检验。2.顺序/等级量表：次低水平，能区分不同类别的大小、等级或事物具有某种特征的程度。无相等单位，无决定零点，也不表示事物特征的真正数量，统计方法有中位数、百分位数、等级相关系数和肯德尔和谐系数。3.等距量表：较高水平，除了代表事物的类别和等级，有相等的单位，但无绝对零点，如海拔、智商、温度等。只能加减，不能乘除。统计方法有平均数、标准差、积差相关系数以及t检验和F检验。4.比率量表：最高水平，除具有前三者的特征外，还有绝对零点。如身高、长度等。能加减乘除，而且统计方法除了可用等距量表的方法外，还可以用几何平均数和变异系数。（三）心理测量：依据一定的心理学理论，使用测验对人的心理特征和教育成就进行定量描述。和物理测量相比：1.物理测量有一个让大众广泛接受的理论和客观规律；对于心理测量而言，对于同一个特质而言，存在不同的理论，也就可能产生不同的测量方法2.物理测量使用的工具较为统一，而同一特质存在多种测量工具，并不统一；3.物理测量对象较为直接，而心理测量测的是同人的心理特质，这些特质具有内隐性，只能通过外在表现测出来，因此心理测量具有间接性；4.物理测量结果较为恒定，受无关变量影响小；而心理测量因测量对象的特殊性而受无关变量影响较大。（四）心理测量与心理测验：心理测量是一种方法，包括测量的理论、编制和分析等等，而心理测验是指具体某个实施测量的工具，比如学籍测验。（五）编制心理测验的4个基本条件：1.行为样本：从个体大量行为中抽取出来的作为直接测量对象的行为。2.标准化：使所有受测的人获得的分数意义完全一样，具有可比性，也就是说影响测验分数的唯一自变量是要测的行为或特征。包括测验内容的标准化、测验条件的标准化、评分规则的标准化以及测验常模的标准化。3.难度或应答率：不同被试在测验项目得分不一样，使测验具有区分度。4.信效度。▲心理测量的早期发展：1860年，费希纳用心理物理法对心理差异进行了测量，认为心理属性是可以量化；1869年，高尔顿提出能力差异可以测量，1884年成立一个“人类测量实验”；1890年，詹姆斯﹒卡特尔首次提出“心理测验”，测大学生的一些能力；1904年，比内-西蒙量表诞生，第一个智力测验量表。二、经典测验理论（CTT）的三个假设是什么？（一）心理特质是可测的且具有某种程度的稳定性，即真分数具有某种程度的稳定性，是一个常数。（二）测量误差完全随机，并服从均值为0正态分布：测量误差是指在测量过程中与测量目的无关的变量所产生的一种不准确或不一致的测量效应。主要来源于测量工具、测量对象、施测者和测量环境等。1.随机误差：由与测量目的无关的偶然因素引起的不易控误差，大小和方向完全随机。2.系统误差：由与测量目的无关的变因引起的一种恒定而有规律的效应，稳定存在于每一次测量一种，如用根据白人编制的智力测验测黑人。3.抽样误差：有抽样变动引起的误差。由于与测量的好坏无必然的关系，所以研究信度或效度时，可以忽略。（三）观察分数等于真分数与误差之和：X=T+E。1.若一个人的某种特质可以用平行的测验反复测量足够多次，其观察分数的平均值会接近于真分数；2.真分数和误差分数之间的相关为0；3.平行测验的假设：以相同的程度测量同一心理特质的测验，其形式和内容可能完全相同，也可能有差异，但要求是以相同程度测量同一心理特质。（1）每个平行测验的平均数应该相等，等于同一心理特质，即真分数；（2）各平行测验的测量误差的平均数相等，且相等；（3）各平行测验的测量误差方差相等，各被试在平行测验上的测量误差方差也相等，且两种测量方差相等。变异数表达式：观察分数包括真分数和误差之和，而真分数又包括与测量目的有关的辨析和与测量目的无关的但稳定的变异。，而评价：1.优点：（1）以弱假设为基础，这些假设容易验证且为大多数测验数据资料满足；（2）建立了一整套的理论和统计方法；（3）浅显易懂；（4）便于在实际测验情境（尤其是小规模资料）实施。2.优点：（1）信度估计精度不高。CTT的理论模式是观察分数等于真分数与误差之和，但在测验中只能得到原始分数的方差，真分数方差和误差方差都无从获取，只能靠平行测验或ζ等价测验进行估计。但实际上，平行和ζ等价测验都是很难获取的，因此信度估计不精确。（2）把误差归为一类，没有区分实际测验情境中的各类测验误差，不说明误差的具体来源和种类；而且，测验结果的精确度（即SE=x·√1−rxx′，通过SE可以估计真分数的置信区间）以测验信度x和测量误差的方差rxx′表示，以一个相同的测量误差作为每位被试的测量误差，不恰当，而且忽略了单个被试在项目上的得分；（3）样本依赖性，各项指标（信效度、难度和区分度）依赖于选定的样本，因施测对象不同指标会发生改变；（4）参数指标配套性差，试题难度和被试的能力水平这两个参数指标未能在同一个参照系上。题目难度的参照系是被试群体，难度0.2表示该试题有80%的被试得分；被试卷面得分的参照系是试卷的全部试题，百分制试卷上被试得分80表示被试在此特定试卷上的得分率为80%，但却不能推断出试题恰好与有80%试卷得分率的被试匹配。三、什么是信度？如何估计信度？提高信度的常用方法有哪些？（一）信度：是指测量结果的可靠性、一致性和稳定程度，r信σT2σX2，它反映了随机误差，可用于比较不同测验分数及解释被试测验分数的意义。信度的操作性定义是两平行测验之间的相关，其相关系数就是信度系数，包括重测、复本和分本信度等。估计方法有：1.重测信度：稳定性系数，同一个量表测对同一组被试测两次所得结果的一致性程度，用皮尔逊相关。反映了随机误差，而不是反映被试心理特点的长期变化。（1）误差来源：所测特质不稳定；被试受前测、历史和成熟的影响；偶发因素。（2）局限性：前测后有练习和记忆；有些测验如创造力不能重测；无法复制相同情境；易引起被试乏味；两者之间的时间不好把握，太短有练习，太长有成熟。（3）注意事项：所测特质稳定、无复本又不受前测影响采用，适合速度测验而非难度。2.复本信度：等值性系数，两个平行的测验测量同一组被试所得结果的一致性程度，用皮尔逊相关。反映的是两个复本的等价程度，不反映测验本身受随机误差影响的程度，所以一定要同时测，所有方面都要相同。（1）误差来源：测验是否等值，如取样匹配、格式、内容、题数、难度、平均数和标准差是否一致；其它无关因素。（2）优缺点：不受练习和记忆影响；可用于长期追踪的前后测量；减少作弊的可能性。但是，缺点是难以保证两个测验平行，而且被试可能仍会有练习效应。（3）稳定-等值系数：第一次测平行测验A，第二次测B，求A与B的相关。3.分半信度：一个测验分成两半后，所有被试在这两半上所得分数的一致性程度。条件是：（1）奇偶需成对；（2）对数30以上；（3）正态。用弗朗那根公式：r2[1−(Sa2+Sb2)Sx2]。4.同质性信度：内部一致性系数，包括分半信度，测验内部所有题目间得分的一致性程度，即所有题目均相关且反应同一种心理特质。（1）ɑ系数：用克隆巴赫系数：当测验题目答案为0/1计分，ɑ[K(K−1)][1−∑pqSx2]；当测验题目答案为其它时，ɑ[K(K−1)][1−∑𝑆𝑖2Sx2]。注意：ɑ系数高，并不代表同质，量表为单维；ɑ系数低也不代表是多维；因为ɑ系数受项目多少和理论架构的影响。比如能力和成绩具有高相关，这两类的题目放在一起也具有高相关，但不是同质，因此必须在理论上确定量表是测的一个特质，才能用ɑ系数。5.评分者信度：多个评分者给同一批人答卷进行评分的一致性程度。如果评分者是两人，用皮尔逊相关；如果为多人，把被试分数换成等级数列，然后用肯德尔和谐系数。（二）影响信度的因素及相应的提高方法：1.样本团体：分数分布越广，样本越异质，团体平均能力水平越适合，信度越高。因此，需要选择适当的被试团体，提高测验在各同质性较强的亚团体上的信度，通常做法是建立各团体的标准化样本。比较时，选择其对应样本进行分析信度。2.测验长度：适当增加测验的长度，增加测验的内容，也增加被试猜测的难度，但新增项目必须与原来的同质，且数量适度。3.测验难度：使所有试题的难度接近正态分布，并控制中等水平。4.测验区分度：努力提高测验试题的区分度；5.无关因素：主试严格执行实施测序，评分者严格按标准评分，施测场地按测验手册的要求进行布置，减少无关因素的干扰。四、什么是效度？信效度的关系？如何估计效度？如何提高效度？（一）效度：一个测验或量表实际能测出其所要测对心理特质的程度。它是一个相对的概念，即相对于测量目的而言且通过行为推测心理特质，不能百分之百准确；它是测量的随机误差和系统误差的综合反映，要从多方面收集数据来证明效度。效度r效V2X2。（二）信度与效度的关系：1.信度高时效度高的必要而非充分条件：当随机误差减小时，增加，r信提高，但只是为r效的提高提供了可能，因为r效是否提高还要看系统误差。而当r效高时，真分数必然高，信度也就必然高。2.测验的效度受信度制约：r效r信。3.信度反映的随机误差，而效度反映了随机误差和系统误差，也就是说，随机误差影响信度和效度，而系统误差只影响效度。（三）效度的估计：1.内容效度：一个测验实际测到的内容与所要测量的内容之间的吻合程度。主要用于成就测验和选拔与分类的职业测验，不适合人格和能力测验主要看所测的内容多大程度反映了所测范围的所有知识点。如一个物理测验需要包括力学、电学、热学等等。确定的方法有：（1）专家评定法：由专家对测验项目与所涉及的内容范围进行符合性判断，这是一种定性分析的方法。验证测验内容效度的一般程序：研究大纲，确定所要测量的全部内容范围——将测验目的具体化为不同层次的测验目标——确定每一层测验目标在整个测验中的比重——编制双向细目表（第1列为每章节，第1行是所测的每一层次）——确定每一小格中的测题数量——按比例随机抽取测验题目——请专家对测题的代表性、适合性进行分析，并作必要的修改，直到大多数专家满意为止。（2）复本法：一组被试在取自同样内容范围的两个测验复本上得分的相关来估计。（3）重测法：前测——教学——后测。（4）内容效度比：𝐶𝑉𝑅ni−N2N2，ni专家中认为某项目代表了相应测验内容的人数，N为参加评定的所有专家的人数。（5）经验法：不同的被试团体在测验上的得分和对每题的反应存在较大差异。2.结构效度：一个测验实际测到所要测量的理论结构和特质的程度又称构念效度或构想效度。主要用于人格测验和智力测验等一些心理测验方面。验证的方法：（1）测验内方法：先考察内容效度，然后分析被试在答题过程中的反应，最后检查测验的同质性。（2）测验间方法：①相容效度：计算新旧同类测验分数之间的相关，相关越高越好，即聚合效度；②区分效度：计算不同结构的测验之间的相关，相关越低越好；③因素效度：通过因素分析找到影响测验分数的共同因素，每个测验在共同因素上的负荷量即每个测验与共同因素的相关。（3）校标关联效度法：用效标将被试分类，看每一类被试在该测验上的表现是否有差异；或者将测验得分分成高分组和低分组，但这两组被试在特质上有无差异。（4）多种特质——多重方法矩阵法：实际上是相容效度和区分效度的综合运用，主要看每一特质在不同方法下的得分情况，然后进行分析。3.实证效度：一个测验对处于特定情境中的个体的行为进行估计的有效性，也称校标关联效度。用于预测人的行为和选拔人才和人才安置。检验方法：（1）相关法：计算测验分数和效标测验之间的积差相关、点二列相关、二列相关或等级相关，它可以提供预测源与效标之间的数量关系，也可利用回归方程来预测效标分数

北师大考博笔记：心理学研究方法(3)：心理测量

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

经典电子元器件知识讲解（PPT56页)

地理教案教学设计教学设计-中国农业

04 橡胶的老化与防护

第3章海运租船运输合同

有效长期成本降低(33)

重庆龙湖房地产项目总体发展战略研究报告_108页

102职业卫生管理制度汇编

改变游戏规则，构建商业模式

第五章GPS定位的坐标系统及时间系统

5000吨每年明胶项目可研

相关文档

相关搜索