您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 综合/其它 > SPSS典型相关分析
SPSS数据统计分析与实践主讲:周涛副教授北京师范大学资源学院教学网站:第二十二章:典型相关分析(CanonicalCorrelation)典型相关分析(CanonicalCorrelation)本章内容:一、典型相关分析的基本思想二、典型相关分析的数学描述三、SPSS实例四、小节典型相关分析的基本思想z典型相关分析是研究两组变量之间相关关系的一种多元统计方法。z简单相关系数;复相关系数;典型相关系数z典型相关分析首先在每组变量中找出变量的线性组合,使其具有昀大相关性;z然后再在每组变量中找出第二对线性组合,使其与第一对线性组合不相关,而第二对本身具有昀大相关性;z如此继续下去,直到两组变量之间的相关性被提取完毕为止;z这些综合变量被称为典型变量(canonicalvariates);第I对典型变量间的相关系数则被称为第I典型相关系数(一般来说,只需提取1~2对典型变量即可较为充分的概括样本信息)。典型相关分析的目的TqTpYYYYXXXX),,,(),,,(2121KK==设两组分别为p与q维(p≤q)的变量X,Y:设p+q维随机向量协方差阵,⎟⎟⎠⎞⎜⎜⎝⎛=YXZ⎟⎟⎠⎞⎜⎜⎝⎛ΣΣΣΣ=Σ22211211其中Σ11是X的协方差阵,Σ22是Y的协方差阵,Σ12=ΣT21是X,Y的协方差阵典型相关分析用X和Y的线性组合U=aTX,V=bTY之间的相关来研究X和Y之间的相关性。其目的就是希望找到向量a和b,使ρ(U,V)昀大,从而找到替代原始变量的典型变量U和V。典型相关分析的数学描述z典型相关系数的数学定义为:bbaabaVVarUVarVUCovVUTTT221112)()(),(),(ΣΣΣ==ρ由于随机变量乘以常数不改变其相关系数,为防止不必要的结果重复出现,昀好在其中附加如下的约束条件:1)(1)(2211=Σ==Σ=bbVVaraaUVarTT记,,则有2112212111ΣΣΣΣ=−−A1211121122ΣΣΣΣ=−−BbBbaAa22,λλ==其中既是A又是B的特征根,a和b就是对应于A和B的特征向量。2λSPSS实例为研究运动员体力与运动能力的关系,对某高一年级男生38人进行体力测试(共7项指标)及运动能力测试(共5项指标)。运动能力测试指标:Y150米跑(秒)Y2跳远(cm)Y3投球(m)Y4引体向上(次)Y5耐力跑(s)体力测试指标:X1反复横向跳(次)X2纵跳(cm)X3背力(kg)X4握力(kg)X5台阶试验(指数)X6立定体前屈(cm)X7俯卧上体后仰(cm)SPSS实例SPSS操作zSPSS采用’Canonicalcorrelation.sps’宏程序来实现。输出结果解释-两组变量间的相关系数SPSS在三个方框中分别输出的是体力测试指标内部的相关系数、运动能力测试指标内部的相关系数,以及两组指标间的相关系数由体力测试指标内部相关系数看,各指标间相关系数较小,即指标间没有多大的重复。如果两个指标相关系数很大,可能这两个指标反映的是同一个方面,可以考虑合并。输出结果解释-两组变量间的相关系数SPSS在三个方框中分别输出的是体力测试指标内部的相关系数、运动能力测试指标内部的相关系数,以及两组指标间的相关系数运动能力测试指标间的相关系数也比较类似(各指标间的相关系数较小),不过y2(跳远)和y4(引体向上)之间的相关系数较大,达到0.6067输出结果解释-两组变量间的相关系数SPSS在三个方框中分别输出的是体力测试指标内部的相关系数、运动能力测试指标内部的相关系数,以及两组指标间的相关系数上表输出的是体力与运动能力之间的相关系数,从二者直接相关系数看,只有X2(纵跳)和y2(跳远)之间关联程度较大(R=0.5584),而其他体力指标和运动能力指标间的直接关联不大,更多的可能是综合影响。由于变量间的交互作用,因此,这个简单相关系数矩阵只能作为参考,不能真正反映两组变量间的实质联系。典型相关系数及显著性检验第一典型相关系数为0.763,第二典型相关系数为0.706,第三典型相关系数为0.607,它们均比体力指标和运动能力指标两组间的任一个相关系数大,即综合的典型相关分析效果要好于简单相关分析。典型相关系数及显著性检验由于此处的典型相关系数是从样本数据算得的,和简单相关系数一样,有必要进行总体系数是否为0的假设检验。此处采用的是Bartlett的χ2检验,零假设为对应的典型相关系数为0。上面的输出结果表明:在α=0.05的情况下,第一与第二典型相关系数是显著的。典型变量的系数-体力变量原始变量(RawCanonicalCoefficients)的典型相关变量的换算系数标准化变量(StandardizedCanonicalCoefficients)的典型相关变量的换算系数e.g.来自体力指标的第一典型变量的计算公式为:U1=0.314X1+0.628X2+0.295X3+0.309X4+0.335X5+0.033X6+0.077X7典型变量的系数-运动能力变量来自运动能力指标的第一典型变量的计算公式为:V1=-0.578y1+0.299y2+0.199y3+0.228y4+0.033y5在第一对典型变量中,大部分变量的系数都比较均匀,无论是体力变量还是运动能力指标的系数都表明,其测试结果越好,泽表明其综合运动能力越强,可以解释为全面能力程度。典型变量的系数-运动能力变量来自于体力指标的第二典型变量为:U2=0.171X1-0.463X2+0.005X3+0.155X4+0.841X5+0.146X6-0.390X7来自于运动能力指标的第二典型变量为:V2=-0.753y1–1.087y2-0.267y3+0.038y4–0.882y5在对二对典型变量中,在体力指标中X2(纵跳)和X5(台阶试验)的系数较大,在运动能力指标中y1(50米跑)、y2(跳远)和y5(耐力跑)的系数较大,所以第二对典型变量可以解释为腿部能力的关系,表示跑和跳的能力。
本文标题:SPSS典型相关分析
链接地址:https://www.777doc.com/doc-1337193 .html