您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 其它相关文档 > 第11章典型相关分析2
第十一章典型相关分析主成分分析、因子分析研究的是一组变量间或一组观测间的相互关系。而当研究两组变量间的相互关系时,一般不采用各自的分析或两个变量一对一的直接分析。例如,在研究一组环境因素与畜禽诸生产性能间的相关性时,通常是把各环境因素当作一个整体,把各生产性能也作一个整体来研究。这时研究两个整体之间的相关可化为研究两个新变量之间的相关关系,而这两个新变量将分别由各自整体中变量的线性组合所构成,因此不会丢失原有诸变量的任何信息。这样构成的两个新变量具有最大相关的性质。类似地还可找出由两组变量构成的第二对线性组合,该组合与第一对线性组合不相关,但该对组合间有最大的相关。如此类推,直到两组变量的相关被分解完毕。这种逐步得到的线性组合称为典型变量,它们之间的相关系数称为典型相关系数。这种分析方法称为典型相关分析(CanonicalCorrelationsAnalysis)。可见,典型相关分析是研究两组变量之间相关关系的一种统计方法,它避免了孤立地对两个变量间的研究,分析结果较为全面,且各组中变量的个数不受限制,两组的内容可以不相同。因此,应用十分广泛。11.1概述在实际工作中,通常接触到的多为样本资料,所以典型相关系数及典型变量多数是从样本资料中获取。其计算方法如下。设有两组变量X1{x1,x2,…,xp}和X2{xp+1,xp+2,…,xp+q}的n次观察值,取自多元正态总体Np+q(μ,∑),由X[X1,X2]算得协差阵为∑的最大似然估计,若对X1、,X2进行标准化,此时协差阵为相关阵R:qpqpRRRRR22211211其中R11为第一组各变量间的相关系数阵,R22为第二组各变量间的相关系数阵,'2112RR各变量间的相关系数阵。设P≤q解得特征方程01222112212RRRR或02221211121RRRR的非零特征根22221r(r≤p)的算术平方根,即为典型相关系数。将求得各特征根四代上两式,可求得与典型相关系数相对应的特征向量(典型变量)αi及βj,于是第i对典型变量(线性组合)为:Vi=α1x1+α2x2+…αpxpWj=β1xp+1+β2xp+2+…βqxp+q其中αi、βj亦称负荷量,用来反映该变量对两组变量的相关中所起的作用或影响的程度。实际工作中对R特征根以及相应特征向量的求得通常借助相关的软件来完成。15.2典型相关分析的SAS过程过程格式:PROCCANCORRVARWITHPARTIATFREQWEIGHTBY选项串;变量名称串;变量名称串;变量名称串;变量名称;变量名称;变量名称串;语句说明:通常只用到第1—3道指令。CANCORR:为典型相关分析过程。其选项串:⑴控制报表打印的有①S,印出平均数与标准差。②C,印出原始变量间的相关阵。③RED,印出典型冗余分析的统计值,其值可用来探讨原始变量被典型变量解释的百分比。④ALL,印出所有的统计值。⑤SHORT,只印出典型相关系数与其F检验的显著性。⑥NOPRINT,不印出分析的结果。⑦NCAN=正整数,印出前n对典型变量的所有统计值。⑵界定计算过程中某些变量的选项有①EDF=正整数,界定F检验的分母自由度,内设值为有效观察值次数总和减1。②RDF=正整数,界定F检验分子的自由度。③NOINT,分析中不包括截距。④VP=典型变量名字,内设值为V1、V2…等。⑤典型变量名字,内设值为等。⑥VN=‘VAR变量名称’,在报表中印出VAR语句中给变量串的命名。⑦WN=‘WITH变量名称’,在报表中印出WITH语句中给变量串的命名。⑶有关回归分析的选项有①VDEPWREG,要求将VAR的变量串当作依变量,将WITH变量串当作自变量进行多元回归分析。②WDEPVREG,自变量与依变量的界定与①相反,作多元回归分析。⑷回归分析中产生统计量的选项有①ALL,要求报表中印出所有统计量。②INT,与B、SEB、T或PROBT联用,要求回归分析的模型中有截距。③B,印出偏回归系数。④SEB,印出偏回归系数的标准误。⑤T和PROBT,印出偏回归系数t检验的t值及概率。⑥STB,印出通径系数。⑦SMC,印出相关指数R2及F检验结果。⑧CORRB,印出回归系数间的相关系数阵。⑨CORR,印出偏相关系数等。VAR语句界定两组变量中第1组变量的名称串。WITH语句界定两组变量中第2组变量的名称串。PARTIAL语句要求执行典型偏相关分析,即对两组变量的偏相关阵进行典型相关分析。FREQ、WEIGHT及BY语句同前述。11.2程序应用例11—1测得18周内密闭式蛋鸡舍内12个笼位上的温度x1、湿度x2、相对湿度x3、露点温度x4、蛋鸡舒适度x5,以及随机抽查位点上(每位64只)40—57周龄罗曼褐壳系商品代蛋鸡的每周产蛋率y1、平均蛋重y2及周总产蛋量y3的资料如程序数据步中。现将x1—x5归类为环境因素一组,把y1—y3归类为产蛋性能一组。试分析环境因素与产蛋性能间的相关关系。1用编程法分析(1)程序optionnodatenonumber;dataxu11a;inputx1-x5y1-y3;cards;27.323.272.321.676.9675.060.622.6328.825.376.324.179.5564.260.619.2230.028.488.327.882.6552.459.315.0233.730.883.030.187.0457.958.216.0736.134.187.332.688.5362.058.316.8930.528.383.927.682.9466.059.219.9133.129.375.028.285.5673.955.920.1432.729.176.728.184.3877.358.220.3334.429.771.928.586.7777.160.120.7932.929.578.928.685.5374.560.720.1630.727.479.026.382.4474.961.221.2531.327.178.925.882.6475.361.020.9331.327.071.725.682.6076.059.517.8628.124.573.423.282.6076.960.518.0025.620.764.518.373.9174.463.720.7426.321.567.519.375.0175.861.820.4326.420.961.018.274.6876.762.320.7624.719.662.317.172.5077.362.220.12;proccancorrall;varx1-x5;withy1-y3;run;(2)输出结果TheCANCORRProcedure⑴MeansandStandardDeviationsVariableMeanStandardDeviationVariableMeanStandardDeviationx130.2166673.301381x581.4605564.902162x226.4666674.002058y171.5333337.586908x375.1055567.956978y260.1833331.845902x425.0555564.522522y319.5138891.974946⑵CorrelationsAmongtheOriginalVariablesCorrelationsBetweentheVARCorrelationsAmongtheVARVariablesVariablesandtheWITHVariablesx1x2x3x4x5y1y2y3x11.00000.97390.70520.96040.9640x1-0.3068-0.7522-0.3399x20.97391.00000.83990.99630.9708x2-0.4680-0.7791-0.4529x30.70520.83991.00000.86450.7750x3-0.7285-0.6268-0.5594x40.96040.99630.86451.00000.9734x4-0.4857-0.7867-0.4586x50.96400.97080.77500.97341.0000x5-0.3555-0.7743-0.4309CorrelationsAmongtheWITHVariablesy1y2y3y11.00000.37760.7732y20.37761.00000.4144y30.77320.41441.0000⑶CanonicalCorrelationAnalysisCanonicalCorrelationAdjustedCanonicalCorrelationApproximateStandardErrorSquaredCanonicalCorrelation10.8758760.8169300.0564720.76715920.7875990.7558510.0920880.62031230.5685890.5507030.1641250.323294⑷TestofH0:Thecanonicalcorrelationsinthe------------EigenvaluesofInv(E)*H---------------------currentrowandallthatfollowarezero-------=CanRsq/(1-CanRsq)EigenvalueDifferenceProportionCumulativeLikelihoodRatioApproximateFValueNumDFDenDFPrF13.29481.66100.60940.60940.0598253.311528.0070.003021.63371.15600.30220.91160.2569372.688220.032230.47770.08841.00000.6767061.913120.1817⑸MultivariateStatisticsandFApproximationsS=3M=0.5N=4StatisticValueFValueNumDFDenDFPrFWilks'Lambda0.059825433.311528.0070.0030Pillai'sTrace1.710765103.1815360.0022HotellingLawleyTrace5.406270543.351514.3150.0139Roy'sGreatestRoot3.294783717.915120.0017NOTE:FStatisticforRoy'sGreatestRootisanupperbound⑹RawCanonicalCoefficients-------------fortheVARVariables----------------------------fortheWITHVariables--------------V1V2V3W1W2W3x10.67899522540.86323029021.6894673603y10.1168612611-0.160550561-0.064745778x2-0.421239948-0.598096879-3.548291853y20.29093032040.4163876272-0.315947897x30.05556742640.2627339142-0.037096402y3-0.1433956050.38926640230.7030791827x4-0.677150223-0.1030457922.9390284274x50.2894184724-0.452187389-0.867429961⑺StandardizedCanonicalCoefficients--------fortheVARVariables--------------------fortheWITHVar
本文标题:第11章典型相关分析2
链接地址:https://www.777doc.com/doc-2242181 .html