您好,欢迎访问三七文档
多元统计学作业——分析报告姓名:代晓双学号:09071601006班级:统计09-2班我国16个地区农民在1982年支出情况的抽样调查数据的汇总资料,每个地区都调查了反应每人平均消费生活消费支出情况的六大指标。对16个地区进行分析。一:数据来源《应用多元统计分析》教材343页例6.4.1二.对于生活消费水平因素的假设:1、食品消费占所有影响变量的主体2、各消费因素之间相互联系3、生活用品及其他与各变量相关4、各消费因素与地区发达程度有关三、操作步骤:报告应用到软件中的因子分析、描述统计分析、单因子检验等检验分析、方差均值分析等。分析描述统计描述现在所需项目输出“描述统计量”及图形分析(如表1等)分析降维因子分析输出“解释的总方差”(如表2)抽取(固定因子数为3)分析降维因子分析旋转输出“解释的总方差”(如表3组)标准化后得分聚类分析:分析——分类——系统聚类(如表4组)T检验:分析——比较均值——配对检验(如表5)分组:数据——分析——描述(如表6)其他:excle表格制作表(如表7组)相关分析(如表8)四、操作结果分析表1等分析结果如下:分析——描述统计——描述——现在所需项目输出“描述统计量”描述统计量N和百分比均值标准差方差偏度峰度统计量统计量统计量统计量统计量统计量统计量标准误统计量标准误文化生活服务支出X61679.871.99%4.99191.630772.659.864.564.9861.091燃料X316201.7711.47%12.61063.7019813.705.182.564-1.0591.091生活用品及其他X516459.2413.13%28.702510.78878116.398.918.564-.1181.091衣着X216471.405.04%29.46256.5897643.425.595.564-.2331.091住房X416523.9011.77%32.743826.51414703.0002.255.5646.1251.091食品X1162266.8056.60%141.675033.317701110.069.809.564.8411.091有效的N(列表状态)16由上表分析如下4点:1、由和可以知道食品消费的数量是最大的,为2266.80,起主体作用,文化生活服务支出相对数量较小,为79.87。且由百分比可以知道食品占多部分高达56.60%,生活用品及其他占13.13%,住房占11.77%,燃料占11.47%,衣着占5.04%,文化生活服务支出占1.99%。因子分析2、由方差可以知道食品的方差最大是1110.069文化生活服务支出方差最小是2.659,从而可以知道食品消费的落差大,不稳定。而文化生活服务支出落差较小,相对较稳定。3、由偏度值>0表示为右偏,偏度值<0表示为左偏,由以上可以知道,平均消费生活消费支出情况的六大指标均为右偏。4、由峰度值>0表示为在均值以上,偏度值<0表示为在均值以下,由以上可以知道,燃料、生活用品和衣着都是在均值以下、食品和文化生活服务支出都是在均值以上。由上图说明:在任何地区食品所占比例都是比较大的,文化生活服务支出各地区差距不大,综合来看,上海、北京、江苏各指标相对较高,说明这些地区相对较发达。上海的住房十分宽松。表2分析结果如下:分析——降维——因子分析——输出“解释的总方差”解释的总方差成份初始特征值提取平方和载入合计方差的%累积%合计方差的%累积%13.55959.31559.3153.55959.31559.31521.31121.84681.1601.31121.84681.1603.61310.21991.3794.3746.23097.6095.1061.77599.3836.037.617100.000提取方法:主成份分析。由上表说明只有选择三个因子才可以保留91.379%>85%,因此固定因字数为3。抽取(固定因子数为3)表3组分析结果如下:分析——降维——因子分析旋转——输出“解释的总方差”标准化后得分(1)由抽取(固定因子数为3)得下表:由以上两表进行对比,说明选择3个固定因子后使得数据的贡献率达91.379%,有碎石图可以看出其数据变化集中情况。(2)由旋转操作得下表:①由旋转矩阵的分析给3个因子进行命名:由因子1的数据发现食品、衣着、住房占比例相当大,命名为“生活消费”;由因子2的数据发现燃料、文化生活服务支出占比例相当大,命名为“享受消费”;由因子3的数据发现生活用品占比例相当大,命名为“发展消费”;②由成分矩阵给出模型:X1=0.908F1+0.295F2+0.035F3;X2=0.870F1-0.205F2+0.078F3;X3=0.099F1+0.892F2+0.482F3;X4=0.811F1-0.207F2+0.057F3;X5=0.913F1-0.280F2+0.193F3;X6=0.599F1+0.500F2-0.614F3;(3)标准化后的得分分析解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差%累积%合计方差%累积%合计方差%累积%13.55959.31559.3153.55959.31559.3153.10951.81651.81621.31121.84681.1601.31121.84681.1601.25520.90872.7253.61310.21991.379.61310.21991.3791.11918.65491.3794.3746.23097.6095.1061.77599.3836.037.617100.000提取方法:主成份分析。旋转成份矩阵a成份123食品X1.744.483.354衣着X2.890.170-.069燃料X3-.057.130.985住房X4.879.215-.051生活用品及其他X5.970.086-.029文化生活服务支出X6.216.960.128提取方法:主成分分析法。旋转法:具有Kaiser标准化的正交旋转法。a.旋转在4次迭代后收敛。成份矩阵a成份123食品X1.908.294.032衣着X2.870-.248.083燃料X3.102.891.429住房X4.880-.209.055生活用品及其他X5.913-.280.193文化生活服务支出X6.599.496-.617提取方法:主成分分析法。a.已提取了3个成份。①由此表因子1可以知道生活消费方面河北、山西、内蒙古、黑龙江、安徽、福建、江西、山东、河南的生活消费水平在平均水平之下,北京、天津、辽宁、吉林、上海、江苏、浙江相对较高。说明北京、天津、辽宁、吉林、上海、江苏、浙江这些地区消费较高。②由此表因子2可以知道享受消费方面北京、天津、河北、山西、内蒙古、上海、浙江、山东、河南的享受消费水平在平均水平之下,辽宁、吉林、黑龙江、江苏、安徽、福建、江西相对较高。说明辽宁、吉林、黑龙江、江苏、安徽、福建、江西这些地区精神世界较丰富。③由此表因子3可以知道发展消费方面北京、山西、黑龙江、江苏、安徽、福建、河南的发展消费水平在平均水平之下,天津、河北、内蒙古、辽宁、吉林、上海、浙江、江西、山东相对较高。说明天津、河北、内蒙古、辽宁、吉林、上海、浙江、江西、山东这些地区消费较高。表4组聚类分析分析——分类——系统聚类快速聚类安徽12福建13江西14黑龙江8江苏10浙江11天津2山东15辽宁6吉林7河北3河南16山西4内蒙古5北京1上海9由于分三类:由上图可以知道:1、上海为一类为发展消费2、内蒙古、山西、河南、河北、江西、福建、安徽、黑龙江、吉林、辽宁、浙江、江苏、山东、天津为一类,为生活消费3、北京为一类为享受消费因子1因子2因子3北京2.04082-0.24218-1.98694天津0.37437-1.102910.64221河北-1.08986-1.060860.31144山西-1.13556-1.32293-0.63094内蒙古-0.67586-0.896210.10462辽宁0.234980.355702.27919吉林0.072561.311100.88614黑龙江-0.420370.43586-0.83205上海2.34017-0.470430.66693江苏0.141070.00149-0.64931浙江0.60833-0.080230.34026安徽-0.317391.40097-0.74482福建-0.357191.62714-0.71155江西-0.699661.466540.40059山东-0.16058-0.642960.75418河南-0.95583-0.78009-0.82995合计2.04082-0.24218-1.98694由以上表可以将上述地区进行分类同样若分3类则1、上海为一类为发展消费2、内蒙古、山西、河南、河北、江西、福建、安徽、黑龙江、吉林、辽宁、浙江、江苏、山东、天津为一类,为生活消费3、北京为一类为享受消费表5:T检验:分析——比较均值——配对检验成对样本检验成对差分tdfSig.(双侧)差分的95%置信区间均值标准差均值的标准误下限上限对1食品X1-衣着X2112.2125029.362097.3405296.56654127.8584615.28715.000对2食品X1-燃料X3129.0643832.253378.06334111.87777146.2509816.00615.000对3食品X1-住房X4108.9312520.855125.2137897.81834120.0441620.89315.000对4食品X1-生活用品及其他X5112.9725026.815866.7039798.68334127.2616616.85215.000对5食品X1-文化生活服务支出X6136.6831332.307338.07683119.46776153.8984916.92315.000对6衣着X2-燃料X316.851877.798081.9495212.6965721.007188.64415.000对7衣着X2-住房X4-3.2812522.688185.67204-15.370938.80843-.57815.572对8衣着X2-生活用品及其他X5.760005.624451.40611-2.237063.75706.54015.597对9衣着X2-文化生活服务支出X624.470626.166741.5416921.1846027.7566515.87315.000对10燃料X3-住房X4-20.1331327.087446.77186-34.56701-5.69924-2.97315.009对11燃料X3-生活用品及其他X5-16.0918811.609732.90243-22.27826-9.90549-5.54415.000对12燃料X3-文化生活服务支出X67.618753.65243.913115.672519.564998.34415.000对13住房X4-生活用品及其他X54.0412518.544394.63610-5.8403613.92286.87215.397对14住房X4-文化生活服务支出X627.7518825.965876.4914713.9156441.588114.27515.001对15生活用品及其他X5-文化生活服务支出X623.7106310.397422.5993518.1702329.251029.12215.000由以上表可以知道:衣着-住房、衣着-生活用品及其他、住房-生活用品及其他的Sig.(双侧)/2>0.05,接受原假设。也就是衣着、住房、生活用品及其他是有联系的,并且联系密切。分组:表6食品消费分组:数据——分析——描述经以上表1和表3组分析可知食品消费占比例最大,对其进行分组得到:食品消费基本集中于130-150之间,两极分布基本均匀,由直方图知道基本呈正态分布。表7组:表格制作(excle表格制作表)A=各地区占本次抽样比率(如:北京的食品消费占所抽样食品消费总和
本文标题:多元统计学分析报告
链接地址:https://www.777doc.com/doc-6193759 .html