您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 实验5多元统计分析spss
青岛农业大学多元统计分析实验报告姓名:庞云杰学号:20155653班级:信计1502指导老师:徐英2017年11月28日多元统计分析实验课:实验五实验题目主成分分析实验目的了解SPSS软件,掌握SPSS软件处理主成分分析的基本操作实验地点及时间信息楼127机房,周二8-9节实验内容1.了解SPSS软件及常用功能;2.了解主成分分析的原理;3.掌握SPSS软件处理主成分分析的操作过程和技巧。实验习题1.题目简述:中国大陆31个省(市、区)2008年第三产业综合发展水平的主成分分析与评估。选取了人均地区生产总值(元)、人均第三产业增加值(元)、第二产业占GDP的比重、第三产业占GDP的比重、第三产业就业人员比重、城镇化水平(%)、第三产业固定资产投资比重八项指标,具体数据见附件。根据以上数据分析结果对全国31个地区的第三产业综合发展水平进行综合评价,并整理实验报告。解答如下:2.(1)首先对原始数据作标准化处理,然后计算标准化后的各指标之间的相关系数矩阵;(标准化过程:点击分析—描述统计—描述;相关系数矩阵过程:点击分析—相关—双变量然后确定。)相关性Zscore:人均地区生产总值/元Zscore:人均第三产业增加值/元Zscore:第二产业占GDP的比重/%Zscore:第三产业占GDP的比重/%Zscore:第三产业就业人员比重/%Zscore:城镇化水平/%Zscore:第三产业固定资产投资比重/%Zscore:人均地区生产总值/元Pearson相关性1.933**.037.532**.760**.930**-.005显著性(双侧).000.844.002.000.000.980N31313131313131Zscore:人均第三产业增加值/元Pearson相关性.933**1-.254.768**.894**.874**.142显著性(双侧).000.168.000.000.000.446N31313131313131Zscore:第二产业占GDP的比重/%Pearson相关性.037-.2541-.734**-.378*.051-.667**显著性(双侧).844.168.000.036.786.000N31313131313131Zscore:第三产业占GDP的比重/%Pearson相关性.532**.768**-.734**1.802**.463**.505**显著性(双侧).002.000.000.000.009.004N31313131313131Zscore:第三产业就业人员比重/%Pearson相关性.760**.894**-.378*.802**1.779**.270显著性(双侧).000.000.036.000.000.142N31313131313131Zscore:城镇化水平/%Pearson相关性.930**.874**.051.463**.779**1-.020显著性(双侧).000.000.786.009.000.917N31313131313131Zscore:第三产业固定资产投资比重/%Pearson相关性-.005.142-.667**.505**.270-.0201显著性(双侧).980.446.000.004.142.917N31313131313131**.在.01水平(双侧)上显著相关。*.在0.05水平(双侧)上显著相关。(2)计算出相关系数矩阵的特征值,以及各主成分的贡献率和累计贡献率,并根据累计贡献率的结果选取合适的主成分;解释的总方差成份初始特征值提取平方和载入合计方差的%累积%合计方差的%累积%14.29161.30661.3064.29161.30661.30621.96928.12489.4301.96928.12489.4303.4266.09195.5224.1492.12597.6465.1151.64999.2956.038.54899.8447.011.156100.000提取方法:主成份分析。(3)计算主成分载荷矩阵,并计算出相关主成分的系数向量,列出主成分的函数表示式;成份矩阵a成份12Zscore:人均地区生产总值/元.862.448Zscore:人均第三产业增加值/元.969.192Zscore:第二产业占GDP的比重/%-.418.847Zscore:第三产业占GDP的比重/%.857-.421Zscore:第三产业就业人员比重/%.944.009Zscore:城镇化水平/%.837.470Zscore:第三产业固定资产投资比重/%.329-.784提取方法:主成分分析法。a.已提取了2个成份。设主成分1为,主成分2为√√𝑦0𝑥∗+08𝑥∗+(−00)𝑥3∗+0𝑥4∗+05𝑥5∗+00𝑥6∗+05𝑥7∗𝑦03𝑥∗+037𝑥∗+00𝑥3∗+(−0300)𝑥4∗+000𝑥5∗+0335𝑥6∗+(−055)𝑥7∗(4)计算选取的各个主成分得分,并以主成分的方差贡献率为权重计算出综合得分;𝑦08𝑥∗+(−00)𝑥∗+0𝑥3∗+05𝑥4∗+00𝑥5∗+05𝑥6∗𝑦037𝑥∗+00𝑥∗+(−0300)𝑥3∗+000𝑥4∗+0335𝑥5∗+(−055)𝑥6∗F𝑎∗𝑦+𝑎∗𝑦地区T1T2Z1Z2y1y2F北京0.8620.4480.4160.3196.84-1.13.88上海4.471.083.04天津0.9690.1920.4680.1371.4521.45浙江0.751.30.83广东0.860.830.76江苏0.371.780.73辽宁0.8370.470.4040.3350.071.440.45山东-0.461.330.09内蒙古0.9440.0090.4560.006-0.371.130.09福建0.060.020.04吉林0.329-0.7840.159-0.559-0.160.410.02湖北0.14-0.88-0.16重庆-0.19-0.4-0.23山西0.857-0.4210.414-0.3-0.971.21-0.25黑龙江-0.690.25-0.35新疆-0.640.14-0.35宁夏-0.910.66-0.37河北-0.4180.847-0.2020.604-1.060.99-0.37青海-0.90.06-0.54湖南-0.61-0.7-0.57安徽-0.93-0.12-0.61四川-0.79-0.54-0.64江西-1.250.41-0.65河南-1.651.27-0.66甘肃-0.72-0.83-0.67贵州-0.48-1.46-0.71陕西-1.04-0.36-0.74海南0.07-2.92-0.78西藏0.73-4.56-0.83广西-0.99-1.03-0.9云南-1-1.4-1.01(5)根据前两个主成分得分绘制散点图并标注出地区序号;实验总结:由实验可以得出:北京、上海、天津第三产业发展水平最高,浙江、广东、江苏、辽宁、山东、内蒙古、福建、吉林第三产业发展水平其次,湖北、重庆、山西、黑龙江、新疆、宁夏、河北、青海、湖南、安徽、四川、江西、河南、甘肃、贵州、陕西、海南、西藏、广西、云南第三产业发展水平落后。实验成绩评阅时间评阅教师
本文标题:实验5多元统计分析spss
链接地址:https://www.777doc.com/doc-6601244 .html