您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 其它文档 > 多元统计分析--小公牛特征因子分析
对小公牛特征数据的因子分析一、提出问题表中列出了拍卖的76头小公牛(小于2岁的公牛)的特征数据。SalePr=售价(美元)Breed=品种:1-Angus,5-Hereford,8-SimentalYrHgt=小牛肩膀高度(英寸)FtFrBody=无脂肪身体部分(磅)PrctFFB=无脂肪身体所占百分比Frame=体型(1-8)BkFat=脊背脂肪(磅)SaleHt=卖出时的肩膀高度(英寸)SaleWt=卖出时的重量(磅)分别用样本协方差矩阵S和相关矩阵R对数据做因子分析并解释这些因子。二、理论分析因子分析的思想是将大量的彼此可能存在相关关系的变量,转化成较少的彼此不相关的综合指标的多元统计方法。优点在于可以减轻收集信息的工作量,且各综合指标代表的信息不重叠。三、实验步骤1、运行SPSS程序,并打开数据。2、点击分析——降维——因子分析3、选中所有变量,将其加入变量框。4、点击描述,选择原始分析结果、系数、KMO和Bartlett的球形度检验;点击抽取,选择相关性矩阵、未旋转的因子解、碎石图;点击旋转,选择最大方差法、旋转解、载荷图;点击得分,选择保存为变量—回归、显示因子得分系数矩阵;点击选项,选择使用均值替换。5、输出结果并保存。6、重复上述操作,但将第4步中选择相关性矩阵改为协方差矩阵,得出另一结果并保存。四、结果分析Ⅰ.利用相关性矩阵对数据分析(1)SPSS输出的第一部分如下:第一个表格中列出了9个原始变量的统计结果,包括平均值、标准差和分析的个案数。DescriptiveStatisticsMeanStd.DeviationAnalysisN售价1742.43623.00476品种4.383.11176小牛肩膀高度50.5221.731576无脂肪身体部分995.9592.70676无脂肪身体所占百分比70.8823.269876体型6.32.92776脊背脂肪.1967.0895776卖出时的肩膀高度54.1262.004576卖出时的重量1555.29129.81076(2)SPSS输出结果文件中的第二部分如下:该表格给出的是9个原始变量的相关矩阵(3)SPSS输出结果的第四部分如下:该部分给出了KMO检验和Bartlett球度检验结果。其中KMO值为0.783,接近1,说明适合做因子分析。Bartlett球度检验给出的相伴概率为0.00,小于显著性水平0.05,因此拒绝Bartlett球度检验的零假设,说明变量之间存在相关关系,认为适合于因子分析。(4)SPSS输出结果文件中的第六部分如下:公因子方差初始提取相关矩阵售价品种小牛肩膀高度无脂肪身体部分无脂肪身体所占百分比体型脊背脂肪卖出时的肩膀高度卖出时的重量相关售价1.000-.224.423.102-.113.479.277.390.317品种-.2241.000.525.409.472.434-.615.487.116小牛肩膀高度.423.5251.000.624.523.940-.344.860.368无脂肪身体部分.102.409.6241.000.691.605-.168.699.555无脂肪身体所占百分比-.113.472.523.6911.000.482-.488.521.198体型.479.434.940.605.4821.000-.260.801.368脊背脂肪.277-.615-.344-.168-.488-.2601.000-.282.208卖出时的肩膀高度.390.487.860.699.521.801-.2821.000.566卖出时的重量.317.116.368.555.198.368.208.5661.000KMO和Bartlett的检验取样足够度的Kaiser-Meyer-Olkin度量。.783Bartlett的球形度检验近似卡方550.198df36Sig..000售价1.000.692品种1.000.703小牛肩膀高度1.000.862无脂肪身体部分1.000.658无脂肪身体所占百分比1.000.647体型1.000.818脊背脂肪1.000.737卖出时的肩膀高度1.000.872卖出时的重量1.000.524共同度较高,表明变量中大部分信息能被因子所提取;说明因子分析的结果有效。同时,该表是因子分析初始结果,表格的第一列列出了9个原始变量名;第二列是根据因子分析初始解计算出的变量共同度。利用主成分分析方法得到9个特征值,它们是因子分析的初始解,可利用这9个初始值和对应的特征向量计算出因子载荷矩阵。由于每个原始变量的所有方差都能被因子变量解释掉,因此每个变量的共同度为1;第三列即红底字是根据因子分析最终解计算出的变量共同度。根据最终提取的m个特征值和对应的特征向量计算出因子载荷矩阵。这时由于因子变量个数少于原始变量的个数,因此每个变量的共同度必然小于1。(5)输出结果第六部分为TotalVarianceExplained表格该表格是因子分析后因子提取和因子旋转的结果。其中,第一列到第四列描述了因子分析初始解对原有变量总体描述情况。第一列是因子分析9个初始解序号。第二列是因子变量的方差贡献(特征值),它是衡量因子重要程度的指标,例如第一行的特征值为4.562,后面描述因子的方差依次减少。第三列是各因子变量的方差贡献率,表示该因子描述的方差占原有变量总方差的比例。第四列是因子变量的累计方差贡献率,表示前m个因子描述的总方差占原有变量的总方差的比例。这里我们可以看到只有前两个因子特征值1;且累积占72.373。因此:我们提取前两个因子作为主因子。解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的%累积%合计方差的%累积%合计方差的%累积%14.56250.68950.6894.56250.68950.6893.83242.57642.57621.95221.68472.3731.95221.68472.3732.68229.79772.3733.98510.94583.3184.5726.35489.6735.3463.84293.5156.2172.41395.9287.1751.94397.8718.1461.62299.4939.046.507100.000(6)SPSS输出了一张图图中:前两个因子都处于非常陡峭的斜率上,斜率大说明去掉这两个变量损失的信息大,第三个因子变缓,因此选择前两个因子作主因子。(7)SPSS输出的该部分的结果如下:即因子载荷矩阵成份矩阵a成份12小牛肩膀高度.923.101卖出时的肩膀高度.919.167体型.885.187无脂肪身体部分.810.030无脂肪身体所占百分比.706-.386品种.625-.559卖出时的重量.522.502售价.305.774脊背脂肪-.416.751a.已提取了2个成份。该表格是最终的因子载荷矩阵A,对应前面的因子分析的数学模型部分。根据该表格可以得到如下因子模型:X=AF+ε即旋转前的因子载荷阵x1=0.305f1+0.774f2f1,f2是因子,同理得X2值-X9值(8)SPSS输出的该部分的结果如下:即为旋转后因子载荷矩阵。旋转成份矩阵a成份12卖出时的肩膀高度.868.344体型.850.309小牛肩膀高度.837.402卖出时的重量.708-.150无脂肪身体部分.704.403售价.668-.496脊背脂肪.045-.858品种.235.805无脂肪身体所占百分比.395.701提取方法:主成份。旋转法:具有Kaiser标准化的正交旋转法。a.旋转在3次迭代后收敛。该表格是按照前面设定的方差极大法对因子载荷矩阵旋转后的结果。未经过旋转的载荷矩阵中,因子变量在许多变量上都有较高的载荷。经过旋转之后,第一个因子含义略加清楚。(9)SPSS输出的该部分的结果如下:该部分输出的是因子转换矩阵,表明了因子提取的方法是主成分分析,旋转的方法是方法极大法。成份转换矩阵成份121.849.5292.529-.849(10)SPSS输出的该部分的结果如下:该部分是载荷散点图,这里为2个因子的因子载荷散点图,以2个因子为坐标,给出各原始变量在该坐标中的载荷散点图,该图是旋转后因子载荷矩阵的图形化表示方式。如果因子载荷比较复杂,则通过该图则较容易解释。(11)SPSS输出的该部分的结果如下:即因子得分系数矩阵该表格是因子得分矩阵。这是根据回归算法计算出来的因子得分函数的系数,根据这个表格可以看出下面的因子得分函数。F1=0.266x1-0.035x2-0.199x3+0.159x4+0.027x5+0.215x6+0.126x7+0.216x8+0.233X9,同理得成份得分系数矩阵成份12售价.266-.301品种-.035.316小牛肩膀高度.199.063无脂肪身体部分.159.081无脂肪身体所占百分比.027.250体型.215.021脊背脂肪.126-.375卖出时的肩膀高度.216.034卖出时的重量.233-.158F2=-0.301x1+0.316x2+0.063x3+0.081x4+0.250x5+0.021x6-0.375x7+0.034x8-0.158x9.(12)见SPSS的输出文件:SPSS根据这9个因子的得分函数,自动计算样本的2个因子得分,并且将2个因子得分作为新变量,保存在SPSS数据编辑窗口中。Ⅱ.利用协方差矩阵对数据分析同相关性矩阵分析法步骤基本相同,得出以下表(1)得到表格,其给出的是9个原始变量的相关矩阵(2)SPSS输出结果的如下:KMO和Bartlett的检验a取样足够度的Kaiser-Meyer-Olkin度量。.783Bartlett的球形度检验近似卡方550.198df36Sig..000a.基于相关相关矩阵售价品种小牛肩膀高度无脂肪身体部分无脂肪身体所占百分比体型脊背脂肪卖出时的肩膀高度卖出时的重量相关售价1.000-.224.423.102-.113.479.277.390.317品种-.2241.000.525.409.472.434-.615.487.116小牛肩膀高度.423.5251.000.624.523.940-.344.860.368无脂肪身体部分.102.409.6241.000.691.605-.168.699.555无脂肪身体所占百分比-.113.472.523.6911.000.482-.488.521.198体型.479.434.940.605.4821.000-.260.801.368脊背脂肪.277-.615-.344-.168-.488-.2601.000-.282.208卖出时的肩膀高度.390.487.860.699.521.801-.2821.000.566卖出时的重量.317.116.368.555.198.368.208.5661.000该部分给出了KMO检验和Bartlett球度检验结果。其中KMO值为0.783,接近1,说明适合做因子分析。Bartlett球度检验给出的相伴概率为0.00,小于显著性水平0.05,因此拒绝Bartlett球度检验的零假设,说明变量之间存在相关关系,认为适合于因子分析。(3)SPSS输出结果如下:公因子方差原始重新标度初始提取初始提取售价388133.662388045.4851.0001.000品种9.679.4711.000.049小牛肩膀高度2.998.5491.000.183无脂肪身体部分8594.344107.6201.000.013无脂肪身体所占百分比10.692.1241.000.012体型.859.2011.000.233脊背脂肪.008.0011.000.077卖出时的肩膀高度4.018.6361.000.158卖出时的重量16850.6621848.8881.000.110(4)输出结果如下:解释的总方差成份初始特征值a提取平方和载入合计方差的%累积%合计方差的%累积%原始1390003.97394.29394.293390003.97394.29394.293218869.1034.5
本文标题:多元统计分析--小公牛特征因子分析
链接地址:https://www.777doc.com/doc-2503195 .html