您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 综合/其它 > 误差分析课件典型相关分析
CompanyLOGO典型相关分析Companyname典型相关分析引言总体的典型变量与典型相关样本的典型变量与典型相关典型相关系数的显著性检验实例分析Companyname引言典型相关分析着眼于识别和量化随机变量之间的相关性,它是两组随机变量之间的相关性在两组变量之下的推广两个随机变量X和Y的相关性可用相关系数来度量该式可以了解每对变量Xi和Yj之间的相关性,但不能全面反映两组变量间的整体相关性,尤其当维数较大时,不利于实际问题的全面分析和解决,(,)()()XYCovXYVarXVarYCompanyname引言分别构造各组变量的适当线形组合,将两组变量的相关性转化为两个变量的相关性来考虑.具体说,设X1,X2,..,Xp,和Y1,Y2,..,Yq,令U=a1X1+a2X2+..+apXpV=b1Y1+b2Y2+..+bqYq确定向量a=(a1,a2,..ap)T与b=(b1,b2,..bp)T,使U,V最大可能地提取X1,X2,..,Xp和Y1,Y2,..,Yq之间的相关性,即达到最大,称(U,V)为一对典型变量.,UVCompanyname引言如一对典型变量不足以提取所给的两组变量的相关性,就需要考虑第二对,第三对等等,并使各对典型相关变量所提取的相关性不重叠.这样我们就将两组变量间的相关性凝结为少数几对典型变量间的相关性,通过对相关性较大的少数几对典型变量的研究来了解原来的两组变量相关性,从而容易抓住问题的本质.Companyname总体的典型变量和典型相关设有两组随机变量,12(,,,)TpXXXX12(,,,)TqYYYY1212(,)(,,,,,,,)TTTTqqXYXXXYYY的协方差矩阵为1112212211()[()][()]TCovXEXEXXEX22()[()][()]TCovYEYEYYEY2112(,)[()][()]TTCovXYEXEXYEYCompanyname总体的典型变量和典型相关111111221111111221TppTqqUaXaXaXaXVbXbYbYbY11111111122111111121()()()()(,)(,)TTTTTTTVarUVaraXaaVarVVarbXbbCovUVCovaXbXab考虑X和Y的线形组合则U1和V1的相关系数为111121,11111221TUVTTabaabbCompanyname总体的典型变量和典型相关典型相关分析即确定和,使得达到最大.对和加以适当的约束以简化目标函数的表达式,使有简单表示的约束条件为1a1b11,UV1a1b11,UV111112211TTaabb于是,典型相关分析的第一步是在上式的约束条件下,求a1和b1,使得达到最大,如此确定的(U1,V1)称为X和Y的第一对典型变量,而相应的相关系数称为第一典型相关系数.11,UV11,UVCompanyname总体的典型变量和典型相关222112222222112222TppTqqUaXaXaXaXVbXbYbYbY21112221212122110TTTTaabbaaaa如果(U1,V2)还足以反映X和Y的相关性,可进一步构造第二对线形组合为了使(U2,V2)反映的X和Y的相关性与(U1,V1)的不重叠,要求(U2,V2)与(U1,V1)不相关,即21212121(,)(,)(,)(,)0CovUUCovVVCovUVCovVUCompanyname总体的典型变量和典型相关11221122TkkkkkppTkkkkkqqUaXaXaXaXVbXbYbYbY(,)(,)(,)(,)0kjkjkjkjCovUUCovVVCovUVCovVU()()1KKVarUVarV如果前K-1对典型变量不足以反映X和Y的相关性信息,构造第K对线性组合约束条件:1jk使得,12kkTUVkkab达到最大(,)kkUV,kkUV称为X和Y的第k对典型变量称为X和Y的第k对典型相关系数()kkpqCompanyname样本的典型变量与典型相关1111(,,,),(,,,)TTiiiipiiiiqxxxxyyyy1,2,,in11122122SSSSS在实际问题中,(XT,YT)T的协方差矩阵(或是相关系数矩阵)一般是未知的,我们所具有的资料通常是关于X和Y的N组观测数据观测数据的样本协方差矩阵作为估计,其中:111122112112111()(),111()(),11()()1nnTiiiiinnTiiiiinTTiiiSxxxxxxnnSyyyyyynnSSxxyynCompanyname样本的典型变量与典型相关11221122ˆˆˆˆˆˆ,TTTTkkkkkkUaxeSxVbyfSy1,2,,kpˆˆ,ˆ,1,2,,kkkUVkp以S代替所求得的典型变量和典型相关系数分别称为样本典型变量和样本典型相关系数.具体地,第K对样本典型相关变量为样本典型相关系数为Companyname典型相关系数的显著性检验120p(1)(1)0111:0:0HH(1)0H设总体X和Y的各对典型参数相关系数已排序为假设检验若不能拒绝,则有120p这时X和Y的各典型变量对不提供X和Y的任何相关信息.因此对X和Y作典型相关分析是无实际意义的,若被拒绝,可进一步检验假设(1)0H(2)(2)0212:0:0HHCompanyname典型相关系数的显著性检验若不能拒绝则认为除第一对典型变量显著相关外,其余各对典型变量的相关性均不显著,可只考虑第一对典型变量.若被拒绝,则需要进一步检验是否为零,以次类推,若假设被拒绝,则进一步假设(2)0H(2)0H(1)01:0kkH3()()01:0:0kkkkHH若不能拒绝,则只要考虑前K-1对典型相关变量.若拒绝,则继续检验是否为零,直到最终检验是否为零.()0kH()0kH1kpCompanyname典型相关系数的显著性检验在总体服从维正态分布条件下,对一般情况第的k个假设,可以用下面的似然比统计量进行检验.2ˆ(1)pkjjk1(3)ln2kkTnpq(,)TTTXYpq(,)pqN当为真时,渐进服从自由度为的分布且当不真时,有偏大的趋势,因而其检验p值为()0kH()0kHkT(1)(1)pkqk2kT02()([(1)(1)]kHkkkpPTtPpkqkt其中为观测值.ktkTCompanyname典型相关系数的显著性检验1221211kkkkkdFd1(1)(1)kdpkqk21(1)(1)12kdwtpkqkSAS系统的典型分析过程proccancorr中,采用的是一个在样本容量N较小时有更好的逼近精度的渐进服从F分布的统计量1(3)2wnpq2222(1)(1)4(1)(1)5pkqktpkqk其中Companyname典型相关系数的显著性检验(1)(1)2pkqk当某个k值使得时,取t=1.当为真时,渐进服从自由度为和的F分布,且大的值意味着应拒绝,顾检验p值为()0kHkF1kd2kdkF()0kH012()((,))kHkkkkkpPTtPFddf所求得观测值.在proccancorr过程的输出结果中,分别就k=1,2,..,p,给出了的值及检验的p的值kfkF12,,,kkkkFddkp利用上述的检验方法,依次就k=1,2,..,p进行检验,若对某个k,检验p值首次大于给定的显著水平,则认为只有前k-1对典型变量显著相关,从而仅用前k-1对典型变量可描述X和Y的整体相关性.Companyname实例分析123(,,)TXXXX为研究空气温度与土壤温度的关系,考虑如下六个变量,X1:日最高土壤温度;X2:日最低土壤温度;X:日土壤温度曲线积分值,它是一种日平均土壤温度的度量;Y1:日最高气温;Y2:日最低气温;Y3:日气温曲线积分值,它是一种日平均气温的度量;共观测了n=46天,令123(,,)TYYYYCompanyname实例分析序号X1X2X3Y1Y2Y3185591518465147286611598465147383641527966142483651588167147588691808468167677691597367131778691597366131884681597567134989711958468161Companyname实例分析123123(,,,,,)TXXXYYY111221221.0000.5711.000R0.8750.7811.000R0.7140.3800.6261.0000.8400.6810.8190.6711.0000.9140.5910.8700.7850.9321.000RRR1-111122221RRRR由SASproccancorr过程可求得的样本相关关系数学矩阵为的3个特征值分别为21ˆ22ˆ23ˆ0.86090.31600.0270Companyname实例分析****1123****1123ˆ0.64850.11490.460ˆ0.08630.20161.2527UxxxVyyy1ˆ0.86090.9278****2123****2123ˆ0.55501.69931.6963ˆ0.23022.8432.7674UxxxVyyy第一对典型变量为第一典型相关系数为第二对典型变量为第一典型相关系数为2ˆ0.31600.5621Companyname实例分析****3123****3123ˆ2.05750.27492.3422ˆ1.66090.39501.6293UxxxVyyy3ˆ0.02750.1658k10.092517.977997.50.000120.66514.63664820.002030.97251.18981420.2816第三对典型变量为第三典型相关系数为检验各对典型变量是否显著相关的检验结果kp2kd1kdkFkCompanyname实例分析由结果可知,只有前两对典型变量显著相关,因此可基于前两对典型变量分析土壤温度及气温的相关.一般来说.典型变量的意义主要由那些系数绝对值较大的变量来决定.第一对典型变量中,主要是日最高土壤温度和“日均”土壤温度的加权和,而主要有“日均”气温控制.因此,第一对典型变量主要是反映了和“日均”气温与日最高土壤温度和“日均”土壤温度的相关性.第二对典型变量主要反映了日最低气温和“日均”气温的差异与日最低土壤温度和“日均“土壤温度的差异之间的相关性.*1ˆV*1ˆUCompanyLOGO
本文标题:误差分析课件典型相关分析
链接地址:https://www.777doc.com/doc-6277445 .html