您好,欢迎访问三七文档
第五章相关系数一、相关概述二、积差相关三、其他相关四、相关系数的解释和应用财富与健康宗教与长寿一、相关概述(一)含义:事物或现象之间的相互关系。想一想:相关关系VS函数关系城门失火殃及池鱼失之毫厘谬以千里蝴蝶效应一、相关概述(二)种类变化方向变量个数相关程度正相关简单相关高度相关负相关复杂相关低度相关零相关一、相关概述(三)相关散布图1.形成2.关注的内容整体形态(方向、相关强度)、异常值x1234y1335一、相关概述(三)相关散布图3.用途(1)是否相关不相关相关一、相关概述(三)相关散布图3.用途(2)是否线性相关非线性相关线性相关一、相关概述(三)相关散布图3.用途(3)线性相关程度一、相关概述(三)相关散布图3.用途(4)相关变化方向05101520250246810121010.210.410.610.81111.20246810正相关负相关一、相关概述(三)相关散布图练习:P72四178,8574,6960,7642,5353,7063,5970,8290,9554,6082,6701020304050607080901000102030405060708090100期末成绩期中成绩期中-期末成绩一、相关概述(三)相关散布图二、相关系数的测定•相关系数含义:度量变量之间关系强度的一个统计量。对两个变量之间线性相关强度的度量称为简单相关系数。•表示符号•总体:ρ样本:r二、相关系数的测定(一)积差相关(皮尔逊相关Pearson’scorrelationcoefficient)1.公式:yxnYYr)(XXR)(2222yynxxnyxxynr学习P57,例1二、相关系数的测定2.注意事项:(1)r值范围(-1,+1)(2)绝对值反映相关程度(3)正、负并非价值判断(4)只能表示线性相关(5)改变计量单位,相关系数不变(6)受异常值影响较大(7)r接近于0,并不一定不相关,有可能是非线性相关。二、相关系数的测定猜一猜:二、相关系数的测定想一想,RorW?二、相关系数的测定3.练习x12341010y1335111r1=0.99254r2=0.48107二、相关系数的测定R=0.994二、相关系数的测定积差相关系数的合并二、相关系数的测定决定系数——相关系数的平方二、相关系数的测定(二)等级相关1.斯皮尔曼等级相关(1)公式)1(611612222nnDnnRRrYiXiR公式中:RX为变量X的等级数,RY为变量Y的等级数,D为两变量的等级数之差,即D=RX-RYn为样本的容量例:10个高三学生学习潜能测验(X)与自学能力测验(Y)成绩序号XYRXRYD=RX-RY190212-1128412111376434-11475545-11573656-11671767-11769878-1186838352596610910-111064910911合计342D二、相关系数的测定例:10个高三学生学习潜能测验(X)与自学能力测验(Y)成绩序号XYRXRYD=RX-RY190212-1128412111376434-11475545-11573656-11671767-11769878-1186838352596610910-111064910911合计342D二、相关系数的测定226634110.7939(1)101001RDrnn二、相关系数的测定(2)适用条件:等级测量数据:两组变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料;总体不一定呈正态分布;样本数量不受30限制。二、相关系数的测定想一想:如果分数相同,应该如何分等级?当出现相同分数的数据时,用它们所占等级位置的平均数作为它们的等级。例:10个学生初一与初二数学成绩斯皮尔曼等级相关系数计算表序号XYRXRYD=RX-RY174762.53.5-1.012717565113727157-244687088005767613.5-2.56.256737941397676599008707772525954621010001074722.56-3.512.25合计71072358.52D二、相关系数的测定二、相关系数的测定例:某工厂对工人的业务进行了一次考试,欲研究考试成绩与每月产量之间是否有联系,若随机抽选了一个样本,其考试成绩和产量数字如下表:r=0.676rR=1斯皮尔曼等级相关系数的精确程度比皮尔逊相关系数要低!等级相关反映的是两变量等级间的相关,并不反映两变量间的数值关系!560580二、相关系数的测定Spearman相关系数应用举例:某班级父亲受教育水平和母亲受教育水平的相关性?斯皮尔曼相关系数:0.718解释?r=-0.292.肯德尔和谐系数肯德尔和谐系数常以rW表示,适用于多列等级变量的资料。可以反映多个等级变量变化的一致性。二、相关系数的测定肯德尔和谐系数的计算公式公式中:rW表示肯德尔和谐系数K表示等级评定者的数目,即变量数n为被等级评定的对象的数目Ri为被评定对象获得的K个等级之和R为所有Ri的算数平均数SSR为R的离差平方和,即nnKSSrRW32121222RRnRRSSiiiR二、相关系数的测定4位教师对6位学生作文竞赛的名次排列学生n=6评价者K=41234134212431332134465655124265656例:4位教师对6位学生作文竞赛的名次排列次序如表所示。问4位教师评定的一致性程度如何?二、相关系数的测定学生n=6评价者K=4Ri12341342110100243131112132134101004656522484512429816565622484Σ8413702iR4位教师对6位学生作文竞赛名次排列的肯德尔和谐系数计算表二、相关系数的测定2222137084/6194iRiiRSSRnRR()23231941940.11111*4*(66)*16*1290121212RWSSrKnn有相同等级时,需要用肯德尔和谐系数的修正公式计算rW系数。CKnnKSSrRW32121公式中:t为相同等级的数目。123ttC二、相关系数的测定P63例6n=7评价者K=10Ri12345678910红3.55233.543243331089橙65766.55776661.53782.25黄55576.56445451.52652.25绿111222211215225青3.53443.535635401600蓝223111132117289紫7765576577623844Σ28013481.52iR表存在相同等级时肯德尔和谐系数计算表5.312221222123312221233333ttC二、相关系数的测定Tips二、相关系数的测定肯德尔和谐系数W值介于0与1之间,计算值都为正值,若表示相关方向,可从实际资料中进行分析。一般而言,如果涉及到使用肯德尔和谐系数来评价评分者的信度,即评分者的一致性,则需要W值达到0.8以上。3.点二列相关和二列相关(1)点二列相关(point-biserialcorrelation)适用条件:一个变量为正态、连续变量,另一个变量为真正的二分名义变量,这两个变量之间的相关,称为点二列相关。二、相关系数的测定点二列相关系数的计算公式:pqSXXrtqppb公式中:是与二分称名变量的一个值对应的连续变量的平均数是与二分称名变量的另一个值对应的连续变量的平均数p和q分别是二分称名变量的两个值各自所占的比例,p+q=1St是连续变量的标准差pXqX二、相关系数的测定五岁幼儿投掷砂袋成绩例:18个五岁幼儿掷砂袋,问性别与投掷成绩的相关情况如何?序号成绩性别序号成绩性别14.01103.4223.62114.9133.52123.7243.22133.3254.41144.7164.81154.8173.82163.1285.21172.9294.71183.42二、相关系数的测定五岁幼儿性别与投掷砂袋点二列相关计算表序号成绩性别序号成绩性别14.01133.3223.62144.7133.52154.8143.22163.1254.41172.9264.81183.4273.82分数总和71.437.533.985.21人数总和1881094.71人数比率0.4440.556103.42平均数3.9674.6883.390114.91标准差0.7090.3330.262123.72代入公式计算:P64例7910.0556.0444.0709.0390.3688.4pqSXXrtqppb二、相关系数的测定二、相关系数的测定4.二列相关计算公式公式中:是与二分称名变量的一个值对应的连续变量的平均数是与二分称名变量的另一个值对应的连续变量的平均数p和q分别是二分称名变量的两个值各自所占的比例,p+q=1St是连续变量的标准差Y为正态曲线下与p相对应的纵高线XpqXpqbxXXpqrY二、相关系数的测定4.二列相关适用条件:两列变量均为正态连续变量,其中一列被人为的划分为二分变量,N应比较大。解:因为语文测验总分与作文分数都为正态连续变量,而作文分数被人为地分为两类,所以,要计算作文与语文总分的相关,应当采用二列相关公式。67.89pX50.85qX4.00x由p=0.60查附表1,根据表中数据计算得,p=0.60,q=0.40解:因为语文测验总分与作文分数都为正态连续变量,而作文分数被人为地分为两类,所以,要计算作文与语文总分的相关,应当采用二列相关公式。67.89pX50.85qX4.00x由p=0.60查附表1,根据表中数据计算得,p=0.60,q=0.40得Y=0.3863,89.6785.500.600.40.654.000.3863pqbxXXpqrY5.Φ相关当两个变量都是二分称名变量,这两个变量之间的关系可以用Φ相关来讨论。Φ相关系数用表示。r当两个变量都各分为两类时,数据在统计表中占有四个单元格,因此这类统计表又称为四格表。Φ相关适用于四格表。二、相关系数的测定四格表的一般形式变量XX1X2合计变量YY1aba+bY2cdc+d合计a+cb+dn=a+b+c+dΦ相关Φ相关系数计算公式aba+bcdc+da+cb+ddbcadcbabcadr巧记公式:Φ相关例题:某区为研究性别与学习数学的关系,随机抽取100名学生,以数学成绩85分为线进行分类,求性别与数学成绩间的相关系数。85分以上85分以下∑男生311849女生292251∑6040100100名学生成绩分布表065.0)2229)(2218)(2931(183129182231r即性别与数学成绩间的相关系数为0.065。1.概念及公式的使用条件当两列变量都是正态连续变量,而且呈直线关系,只是两列变量都被人为地变成二分变量,表示这两列变量之间的相关称为四分相关。(二)四分相关2.四分相关的计算方法计算两列变量之间的四分相关,最常用的方法是皮尔逊提出的余弦法,其公式为:)1180cos(bcadrt解:将上表中的数据代入公式里,得例如:下表的数据是根据377名学生在数学和物理两门课的考试成绩整理而成的。两门课的成绩为正态连续变量,只是分成了及格和不及格两类,试计算这两门课成绩的相关系数=cos73.013=0.2919线性相关小结X变量Y变量积差相关连续、正态数据,30个以上连续、正态数据,30个以上斯皮尔曼等级数据等级数据肯德尔2列以上等级变量点二
本文标题:第五章-相关系数
链接地址:https://www.777doc.com/doc-6060231 .html