您好,欢迎访问三七文档
1第五讲测量法一、测量概述测验与测量(measurement)是教育科学研究中经常使用的一种收集数据的方法,kerlinger(1986)将测量定义为:按照规则给对象或者事件赋值,测量就是根据某种规则把所观察的对象的属性予以数值化的过程(李秉德,1986;李方,1989)。对心理属性进行测量是古人早已认识到的,《孟子》中有“权然后知轻重。度然后知长短。物皆然,心为甚”,这是中国古代思想家最早论及心理属性的测量问题。但我国的心理测验的科学化过程却是晚近时期才有的事,1916年樊炳清最早介绍“比纳西蒙测验”,1921年廖世承、陈鹤琴编写《心理测验法》,该书曾经风行一时。当时的燕京大学,北京大学,清华大学,北京师范大学等学校的教育系和心理系师生共同编制了40多种测验。当时的工作是引进,自制,修订相结合。自此以后,先后出现了张耀翔(1893-1964),陆志韦(1894-1970),肖孝嵘(1897-1963),艾伟(1890-1955),周先庚(1903-),丁赞(1910-1968)等比较有影响的心理学者在测验领域作出了重大贡献。新中国成立以后,心理测验受到前苏联批判“儿童学”的影响,成为科学研究的禁区答30年之久,当时主要是担心把智力测验作为判断个体智力水平的唯一标准,甚至作为决定今后发展前途或者命运的依据。1979年以来,越来越多的人承认心理测验作为心理学研究方法之一在因材施教、人才选拔、心智缺陷的早期诊断、疗效判断、预后估计、教育、管理科学等方面,都是很有用的。但目前为止,测验科学已成为许多行业的重要工具。测量中必须考虑的一个重要问题是赋值规则。二、心理测验的标准化和模型心理属性是不能直接测量的,只能通过个体对测验题目的反应推论他们的心理特征。我们的目的是想准确地把握心理特征,但通常心理测验实际测量的却是行为反应。从操作的角度看,心理测验是测量一个行为样本的一种程序(车宏生,1995)。定义测验是测量行为的一种程序,是指测验在编制、施测和评分方面都有某种确定的规则。为了准确估计被试的心理属性,需要控制测量误差。控制测量误差的重要手段是使测验情景对所有人都是相似的。这种控制的方法称为标准化。标准化有许多方面。标准化的目的是为比较测验分数。心理测验的程序必须表述清楚,所有被试和主试都不会产生误解。测验的规则应清楚到如此地步,以致于不再需要更多的说明,就可以做了。标准化的主要含义之一是:不同的人按照测验的指导语操作,应该能够得到相似的测验结果。标准化的主要内容有:1)测验题目相同。2)在相同的条件下接受测验。这里包括对实施测验的时间、地点、环境条件、主持测验的人以及测验标准时间、标准化的指导语进行规定。指导语应该包括两个方面的内容,一部分是指导语用于测验现场的主持者如何实施测验,称为对主试的指导语。另外一部分指导语指导被试如何解答题目或者,称为对被试的指导语。例如,california心理测验量表的指导语。“这本小册子包含有对一系列观点的陈述,阅读每一条陈述,看看自己对它的感觉如何,然后在特别答案纸上标出你的答案。不要在这本小册子上标任何记号。假如你同意某个观点,或感到该观点如实地反映了你的情况,请回答2“是”,假如你不同意,或感到它没有真实地反映你的情况,请回答“否”。“假如你感到无法回答某些问题,可以略去不答。但是,在给答案纸上作标记时,一定要使答卷纸的号码与问题的号码保持一致。”一般指导语中应该包含一些例题。对主试的指导语不印在测验问卷上,一般情况下,它印在测验的说明上。对主试的指导语通常包括对测验细节问题的进一步说明和解释,以及对现场施测如何组织的说明。例如,怎样分配测验材料,怎样收集测验材料和答卷纸等等。3)记分方法的标准化。记分标准化就是详细规定记分的规则,使每一个记分者都可以按照同样的标准规则记分。关键是记分方法客观化。标准化的好处是可以比较测验结果,有利于学术交流;标准化的测量总是和量表的性质有关。三、心理测量量表的数学性质理想的测量工具应该有一个绝对零点和相等的单位,但心理量表很难满足这样的条件。例如,智力等于零是很难确定的。如果一个量表满足上述条件,称为比例量表。可以进行四则运算。如果有相等的单位但没有绝对的零点,称为等距量表。可以进行加减运算,不可以乘除运算。如果没有相等单位,也没有绝对零点,只能将一组人或者事物按照某种属性的多少排列出等级次序,称为等级量表或者顺序量表如果是等距量表,可以对测量结果进行多种统计分析。如果是等级量表,原则上不允许对测量结果进行四则运算,心理测量工作者总是力图使心理测验量表达到或者接近等距量表的水平。在许多研究中,我们假定等级量表接近等距量表,并按照等距量表数据处理的规则处理测量结果。如果一个心理学家假定一个量表是等距量表,实际上它并不是,在研究工作中将会发生什么样的错误呢?结果可能是对该测量属性和其它变量之间的关系作出错误的说明。例如,他可能报告说,两个研究变量之间存在线性关系,而实际上是另外一种曲线函数关系对可能会更确切地描述这两个研究变量之间的关系。错误发生了,我们要问,错误的程度有多大呢?结合目前心理学研究中使用的统计分析技术考虑,多数情况的回答将是:错误的程度是非常微小的。目前,绝大多数的研究报告都以相关和平均数差异的形式说明研究结果,而变量观测值的单调变化(monotonictransformation)对相关的影响和变异数分析结果的影响是非常轻微的。例如,误将一个变量的平方根代替该变量进行计算,得到相关系数为0.50,如果用真实的原变量进行计算会是多少呢?一般地这个变化可能很小,比如说是0.45-0.55之间。什么是变量测量值的单调变化呢?如果Y和X之间存在函数关系,例如,Y=2X+3,X变量每取一个值,Y变量都有一个值与X对应,并且,如果X2大于X1,Y2一定大于Y1,称Y是X的单调上升函数;Y=2X+3就是单调下降函数。如果一个变量观察值都发生单调变化,这些测量值之间按照大小排列的序列不会变化,因此,测量值之间的次序位置不会变化。3相关主要地与个体在两个测量中的等级次序有关,如果这个次序不被破坏,分布形式的改变只能造成相关系数的微小变化。相关系数是许多复杂数学分析的基础(例如,聚类分析和因素分析),那么,很显然变量的单调转换对这些复杂分析结果的影响也是很微小的。在分析不同实验组的平均数差异时,主要牵涉到不同变异来源的变异数比例(方差分析),变量的单调变化对这种分析结果的影响也是很小的。结论:在多数情况下,量表的单调转换对研究结果并没有太大影响。然而,当需要精确地确定变量之间关系细节时,量表的零点和刻度间距是不能随意改变的。例如,确定心理物理关系,确定学习曲线的形状。四、心理测验量表模型绝大多数测验都要涉及三个维度,即,被试,刺激,反应。为了工作方便人们经常将其转换为一维的问题来处理。有的量表量人,有的量表量刺激。我们经常按照题目特性曲线来分析量表。如果一个被试对测验题目作出正确的回答或者肯定性的回答,称他的反应为正反应。采用直角坐标系中的一条曲线可以表示一个题目的正反应概率与待测属性的关系,这种曲线被称为题目特性曲线。坐标横轴表示待测属性,纵轴表示正反应概率。1决定性模型又称为古得曼模型,研究者假定,在待测属性的某一点以下,被试对题目正反应概率为零,只要超过这一点,被试者对题目的正反应概率就是1。决定性模型可以是一个题目,也可以是一组题目,例如,你的身高高于1.90(1.8,1.7,1.6)米吗?我们将决定性量表模型列表如下:表1:符合单调决定模型的反应题目人1234A√B√√C√√√D√√√√4一般称这种模型为Guttmanscale。但这种心理测验量表很难实际应用。主要是因为:(1)心理测验题目和心理属性很少有那样的相关,一般很少超过0.40,(2)如果有几个互不相关的问题,只要它们的难度相关很大,就有可能得到上述反应模式,但量表测量的不是同一种属性。2概率模型又称为瑟斯顿模型(thurstonescale),待测属性是连续的,题目特性曲线近似于分布曲线。一般只用于态度测量。第一步:收集或者编写大量的态度陈述句,然后在预备性测验中让被试对这些陈述句作出肯定或者否定的评价。评价等级一般为11个,从最强烈的肯定到最强烈的否定。最后按照下列两个标准从大量的题目中精选出10-20个题目,作为对某种态度的测量量表。标准1:组成题目的一致性较好。标准2:从态度的一个极端到另外一个极端,题目的分布比较均匀。该类量表的实质是,每一个题目都应该在待测属性的某一区域被作出正反应。一般将整个量表所包括的题目分数的平均数作为量表分数。能力测验显然不能使用瑟斯顿模型测验。3有一定分布形状的单调模型有些测验假定,题目特性曲线是单调变化的,并且曲线符合某些统计要求。最经常的假定是:题目特性曲线是正态分布的累积曲线。正态累积曲线的重要性在于:在待测属性的一定水平上,该题目可以有很高的辨别力。具有高辨别力的区域是曲线的陡峭上升部分,该部分愈陡峭,题目与属性的二列相关程度愈高。4无一定分布形状的单调模型三条假设。①每一个题目有一单调特性曲线,但形状可能各不相同;②对于一套特定的题目,特性曲线的总和近似于一条直线;③整套题目倾向于只测量一个属性。符合上述三条假设的量表称为“总加模型量表”或者“线性模型量表”。五、测量的类型实际上,这里涉及到对测量的分类标准问题,介绍几种分类方法。1根据测量的内容分类智力测验,能力倾向测验,教育测验(又称成就测验),人格测验(情绪、需要、动机、兴趣、态度、性格);2根据测量的人数分类个别测验,团体测验;3根据测验材料分类5语言或者文字测验;非文字测验或者操作性测验;4根据测验的功能分类预测测验(例如,智力测验,能力倾向测验)和成就测验(各类教育测验该属此类);难度测验和速度测验;普通测验和诊断测验。六、测验的编制1明确测验目的①明确测量目标;要测量的心理功能是什么,是个性还是能力,有了目标后再确定其结构和内容;例如,精神分析学派采用意识的层次来解释个性的结构,而有的学派却用特质或者类型来说明人的个性结构。②明确测量对象;明确要测量的对象是个人还是团体,是成人还是儿童。例如,EYSENKIC个性问卷就分成人和儿童两种;③明确测量用途;用于解决的问题是选拔、诊断或者为评价、分类。2确定结构所包含的具体内容;具体的内容和内容的比重。例如,韦氏智力测验结构模式为言语智商和操作智商两块。内容包括知识的保持、理解力、判断力、推理能力、概括能力、注意力、记忆力以及对空间情景的分析综合能力。例如,EYSENKIC个性测验(EPQ)中,根据特质理论,通过因素分析,归纳出个性包括三个基本特质:内外倾,情绪性和心理变态倾向。卡特尔提出个性因素由16个因素组成,称为16PF。携带一些16PF问卷示范给学员。3选题选题是否恰当,直接影响测验的好坏。4试用编好后在小范围内试用,检验该工具的信度和效度,初步确定此工具是否可用。5编制成测验至此已初步定型,可以着手有关标准化的工作了。标准化包括:确定施测规则(指导语、时限)以及评分方法。更重要的是建立常模。最后,我们将心理测验编制过程用流程图来表示。6心理测验编制过程七、项目分析确定目的在实践中试用明确内容的结构将不合适的项目删除或替换明确目的、意义与内容进行信度、效度、项目区分度检验编制出反映该结构的项目(即将各成分转换为可操作语言)明确具体内容的成分明确结构所包含的具体内容编制成最后的测验进行小范围使用,初步确定该工具是否可用对测验结果进行技术分析,明确该测验的信度、效度水平,进行标准化工作编制出测验手册,准备使用对被试中出现的问题进行纠正在较大范围内取样进行测验7就是检验测验中各个项目的好坏。因为一个好的测验,其中每个项目必须有较高的区分度、适当的难度。项目分析包括检验测验中每个项目的应答率、难度、区分度。广义上说,项目分析包括定性分析和定量分析两部分,定性分析就是要回答测验是否具有内容效度。1难度①以被试完成每一项目的平均时间来估计难度。②以被试答对或者通过每个项目的人数百分数比来估计。P=项目难度(通过率);N=全体受
本文标题:第五讲测量法
链接地址:https://www.777doc.com/doc-2190222 .html