您好,欢迎访问三七文档
人才测评·第二讲华南农业大学经济管理学院陈灿-2014-第一个也是最大的难题测量对象的性质:主观的潜在的“看不见、摸不着”,如何测量?观察——测量观察:人的情绪识人CASE:爱情开篇案例:测量爱情“也许,定义爱情是天底下最困难的事,因为,有一千个爱情故事,有一千个不同的答案!”看看以下对“爱情”的观察:这是刻在英国马歇丘雪斯郊外一块墓碑上的征婚广告:“纪念约翰·费德斯顿,死于1080年8月10,他很为他的遗妻悲伤,极希望有情人去安慰她。她很年轻,芳龄36岁,并具有一切好妻子的美德。她的住址是本地教堂街22号。”费德斯顿先生已经永远永远睡着了,但他的爱却穿透了长夜,永远熊熊不息地燃烧着!我无法控制自己的眼睛,忍不住要去看他,就像口干舌燥的人明知水里有毒却还要喝一样。我本来无意去爱他,我也曾努力的掐掉爱的萌芽,但当我又见到他时,心底的爱又复活了。谁说现在是冬天呢?当你在我身旁时,我感到百花齐放,鸟唱蝉鸣。——夏洛蒂·勃朗特《简爱》我也说不准究竟是在什么时间,在什么地点,看见了你什么样的风姿,听到了你什么样的谈吐,便是使得我开始爱上了你。那是在好久以前的事。等我发觉我自己开始爱上你的时候,我已是走了一半路了。——简·奥斯汀《傲慢与偏见》“我在这世上最大的苦恼,就是希斯克里夫的苦恼;他的每一个苦恼,从刚开头,我就觉察到,切身感受到了。我生命中最大的思念就是他,即使其他一切都毁灭了。独有他留下来,我依然还是我。假使其他一切都留下,独有他毁灭了,那整个宇宙就变成一个巨大的陌生人,我就不像是他的一部分了。”——艾米莉·勃朗特《呼啸山庄》你心里的爱情含义是什么?或者你所认同的关于爱情的观点?鲁宾对“爱情”的测量1、他从文艺着作、普通常识及人际吸引之文献资料中,寻找拟定叙述感情的题目。2、美国某大学的学生作为问卷调查对象,请学生们同时根据自己对朋友和情人的感觉对测项评分。3、找出有显著区别的项目/题目,建立喜欢量表与爱情量表4、通过因子分析,找出构成爱情的因素。测量量表(1/2)测量:按照法则给事物赋予数值;其中,法则是将事物的属性转变为数字的特定程序。量表的特征量值:具有强度的特征。等距:在量表中任何两个数值之间的差别与另外两个数值之间的差别具有相同的含义的时候,量表就具有等距的特征。绝对零点:当测量的特征根本就不存在的时候,我们就称之为绝对零点。四种尺度类别尺度(nominalscale)测量水准最低一个集合的所有成员都被分派到相同的数字,并且没有两个集合被分派到相同的数字。等级尺度(ordinalscale)物体或事物能够依操作定义所界定的明确特征或属性而排列大小或程度。等距尺度(intervalscale)要求尺度上的等差代表所测量的特质的量之等差。等比尺度(ratioscale)测量的最高水准除以上特征外,还具有绝对零点。测量量表(2/2)量表的种类1、类别量表1-黄种人;2-白种人;3-黑种人2、顺序量表身高第1-姚明;2-王治郅;3-易建联3、等距量表华氏温度表4、比率量表开氏温度表;速度等可以进行的运算频数分布可以运算但结果难以解释可以进行任何算术运算并进行有意义的解释;但不能用比率运算可以进行任何数学运算并解释百分等级(percentilerank)百分等级:“有百分之多少的分数(观测值)落在一个特定的分数(观测)值之下?”1、计算有多少观测值在我们感兴趣的特定分数值之下。2、计算观测值的总数。3、用特定分数值之下的观测值个数(步骤1)除以观测值的总数(步骤2)。4、将步骤3的结果乘以100。例:在50000名选手中排名62:[(50000-62)÷50000]×100=99.88例如:语文英语数学考試成績786558百分等級587073百分位数(Percentiles)百分位数(Percentiles)是分数分布中的一个特定的分数值或点,它是一个原始分数。例如:中国的百分等级是44,百分位数是40/1000。注意:联系分数代表的特定意义来理解。考虑总体的情况。其中,Pm——第m百分等级对应的百分位数;L——Pm所在组的组实下限;U——Pm所在组的组实上限;f——Pm所在组的次数;Fb——小于L的累积次数;Fa——大于U的累积次数。N——总体样本量【例】某省某年公务员考试考生分数分布如下表所示,预定取考分居前15%的考生进行面试选拔,请划定面试分数线。分数分组次数向上累积次数向下累积次数百分等级95~9971640710090~941616332399.5785~895316177698.6080~8478156415495.3775~7990148624490.6170~74119l39636385.1265~69159127752277.8760~64156111867868.1755~5914096281858.6650~5414582296350.1245~49140677110341.2840~44135537123832.7435~39130402136824.5130~34126272149416.5925~297814615728.9020~24256815974.1515~19204316172.6210~14162316331.405~97716400.4385.12=1396/1640解:由于预定取考分居前15%的考生进行面试,即有85%的考生分数低于划定的分数线,由此可知,分数线在70~74这一组中。标准分数1、是将原始分数与平均数的距离以标准差为单位表示出来的量表;2、其基本单位是标准差;3、常用的标准分数有:z分数、Z分数、T分数、标准九分数、离差智商(IQ)等。常模(norms)常模是某一群体在特定测验上的表现情况。常模有多种表示方法:Z分数、百分位数和平均数、标准分数等。当测验在一个样本群体中运用,并获得这个样本的分数分布的时候,测验的常模就建立了。有些测验在不同的年龄群体中使用不同的常模。例子痕迹痕迹:与同伴相比倾向于保持保持在相同水平上的趋势称之为痕迹。标准参照测验常模参照测验(norm-referencedtest)把每一个被试的成绩与常模进行比较。例如,前面提到的,根据总体成绩评定A、B、C、D、E五个等级标准参照测验(criterion-referencedtest)用于描述考生在特定类型的技能、任务和知识方面的表现水平。如:IQ测试;算术能力测试信度的历史和理论(1/3)误差的概念心理学及至社会科学的测量都非常困难。斯皮尔曼的早期研究《两事物间联系的证据及其测量》,1904年桑代克《心理与社会测量理论导论》,1904Cronbach(α系数)潜变量的量化项目反应理论信度的历史和理论(2/3)测验分数理论的基础真分数(truescore)和观测分数之间的差异就是测量误差(measurementerror)。X(观测分数)=T(真分数)+E(误差)经典测验理论的一个主要假设:测量误差是随机的。弹性尺码:测量的尺度是主观的,随机变化信度的历史和理论(3/3)领域抽样模型(domainsamplingmodel):使用有限的测验项目来代表一个复杂的结构所带来的问题。注意:此处的样本是测验的题目而不是被试长的测验样本项目较多,短的测验样本项目较少;但每一个项目对于所研究能力或行为的代表性相等。真分数:个体在能力或行为总体上的分数。信度:个体在较短测验上的观测分数的方差和较长测验真分数的方差的比率。信度模型22XTr信度真分数方差观测分数方差估计测验信度的方法重测法:时间取样,考察不同场合的测验结果的一致性。重测信度(test-retestreliability)平行测验技术:项目取样,评估不同测验之间的一致性。平行测验信度(parallelformsreliability)内部一致性技术:考察被试在测验的相似项目之间的表现情况。分半技术;KR20公式;系数重测信度(test-retestreliability)适用范围:所测量的“特质”或特征不随时间而改变的情况。估计方法:1、在两个不同时间进行同一测验2、计算两次测验之间的相关迁移效应(carryovereffect)练习效应(practiseeffect)注意:时间间隔;测验特征的变化平行测验信度(parallelformsreliability)又叫等值信度(equivalentformsreliability)、平行信度功能:考察误差的方差是不是由于编制者选择了特定系列的项目所导致的。估计方法:1、为同一测验设计两个等值的版本2、将两个版本在同一天施测于同一群被试3、计算两个版本的皮尔逊积差相关系数局限性:实践中很难拥有两个版本的测验。分半信度(split-halfreliability)估计方法:1、对被试施测一个测验;2、人为地将测验分为两半,分别计分;3、将两部分的分数进行比较:(1)计算两个部分之间的相关系数(2)利用Spearman-Brownformula来修正。rr12修正后的分半信度修正前的分半信度KR20公式(1/2)适用范围:测验项目是0、1计分的情况。N=测验的项目数S2=总的测验分数的方差p=每一个项目的被试答对比率(各个项目上被试回答情况彼此独立)q=1-p每一个项目的被试答错比率)(12220SpqSNNrKRKR20公式(2/2)!只有在测验的各个项目之间存在协方差的情况下,即项目之间存在相关的时候,KR20公式计算的信度才不为0。项目数越多,信度越高。KR21公式:前提假设:所有项目具有相等的难度,或整个测验的平均难度水平为50%。通常低估了分半信度221111SNXXNNKR系数(1/2)Cronbach:用于估计项目非0、1计分的测验的内部一致性。所有的内部一致性测量,都是去评估测验的每一个项目测量同一特质的程度。因素分析(factoranalysis):将项目划分到具有内部一致性的不同子集中去。2221SSSNNi系数(2/2)使用分半技术时,当测验两部分的方差不等的时候,使用系数。222212)]([2xyyx用于估计分半信度的系数整个测验的分数方差测验两部分的方差行为观察研究中的信度对行为进行直接观察也涉及到信度问题。估计观察者的信度:考察两个或更多的观察者之间相一致的次数所占的百分比。库珀统计量(Kappastatistic)与信度评估方法相关联的误差来源误差来源例子方法如何评估时间取样在两个时间点施测同一测验重测两次测验分数的相关项目取样用不同的项目评估同一特征备择版本或平行版本具有不同项目的等值测验的相关内部一致性同一测验项目的内部一致性1、分半2、KR203、1、测验分半后两半相关的修正2、3、略观察者的差异不同观察者的记录库珀统计量略什么样的信度是可信的?一般情况:0.7-0.8涉及到个体未来的决策时,信度应该要求更高(0.95)面对低信度怎么办?(1/3)增加测验项目理想信度水平下的测验长度:)1()1(00ddrrrrN理想信度水平测验长度是当前测验版本长度的倍数理想的信度水平当前测验版本的信度水平案例:因子分析测项因子负载%ofVariance决策质量本公司战略决策能使企业达到其目标。.8758.63本公司战略决策与企业的长期战略目标一致.8316.89本公司战略决策有助于提高企业的整体效率.818.19决策承诺企业管理团队支持战略决策.776.61企业管理团队愿意为确保战略决策的成功付出极大的努力.855.48为了企业的利益,管理团队成员愿意相互讨论战略决策.854.20说明:主成分分析和正交旋转被用于发现最优的因子结构。测项在主成分(因子)上
本文标题:人才测评第二章
链接地址:https://www.777doc.com/doc-1021095 .html