您好,欢迎访问三七文档
时间:2016年3月10日复相关系数概念及应用报告人:XXX数据获取及预处理1、复相关系数的定义2、复相关系数的计算3、复相关系数的应用主要内容01复相关系数的定义PARTONE1.1定义(1)复相关系数是反映一个因变量与一组自变量(两个或两个以上)之间相关程度的指标,是度量复相关程度的指标(2)复相关系数越大,表明要素或变量之间的线性相关程度越密切(3)复相关系数(多重相关系数):多重相关的实质就是Y的实际观察值与由p个自变量预测的值的相关02PARTTWO复相关系数的计算2.1简单相关系数(1)统计学家卡尔·皮尔逊设计的统计指标,或称线性相关系数、皮氏积矩相关系数等,是衡量两个随机变量之间线性相关程度的指标,通常以表示(2)计算公式xyrr-110.8-1.00.6-0.80.4-0.60.2-0.40.0-0.2r:极强相关:强相关:中等相关:弱相关:极弱相关或无相关2.2计算(1)测定一个变量与其他多个变量之间的相关系数解:①不能直接测算②所以考虑构造一个关于的线性组合,通过计算该线性组合与之间的简单相关系数作为变量与之间的复相关系数12,,,kxxx12,,,kxxxyyy12,,,kxxx(2)计算公式①用对做回归得到[b,bint,r,rint,stats]=regress(Y,X,alpha);b是回归系数向量,bint是b在95%置信度下的置信区间,R是残差序列,rint是残差在5%显著性水平下的矩阵,可用于判断模型的有效性,stats是一个包含模型统计变量的向量y12,,,kxxx𝑦=𝛽0+𝛽1𝑋1+⋯+𝛽𝑘𝑋𝑘②计算和之间的简单相关系数,即是和之间的复相关系数:y𝑦y12,,,kxxx𝑅=𝑦−𝑦𝑦−𝑦𝑦−𝑦2𝑦−𝑦20≤𝑅≤1(3)相关系数和复相关系数取值区间不同在两个变量的情况下,回归系数有正负之分,所以在研究相关时,也有正相关和负相关之分;但在多个变量时,偏回归系数有两个或两个以上,其符号有正有负,不能按正负来区别,所以复相关系数也就只取正值Matlab里面的函数R=corrcoef(X,Y)03PARTThree复相关系数的应用3.1应用实例(1)背景:将13路传感器PCA分解后取前两个主成分,计算其对环境因素(气压、温度、湿度)的复相关系数②求解PCA1和变量之间的简单相关系数𝛽0𝛽11𝛽12𝛽13𝑅PCA1-4.2102-0.05410.16470.00210.4250(2)求解过程①将已知变量PCA1对环境因素(气压、温度、湿度)做回归谢谢聆听!Thanksforlistening!
本文标题:复相关系数
链接地址:https://www.777doc.com/doc-2082383 .html