您好,欢迎访问三七文档
班级:11级统计二班学号:201106010215姓名:聂廷侦时间:2014年6月28日多元统计分析应用关于城镇各个行业就业人数平均工资的多元统计分析摘要20世纪90年代以来,随着市场经济体制进程的加快和经济结构的调整,我国的经济出现了快速的发展。就业人员的工资也随之而增长。由于我国就业人员整体素质普遍低下,我国的分配制度并不是很完善等原因,导致就业人员工资在各行业和各部门的差距较大。随着经济的发展,这个差距越来越大。由于我国人口众多,素质较低,而且就业观念较落后,导致我国劳动力普遍廉价,就业职工工资普遍低下。刚毕业的大学生人数众多,城市发展速度与农村发展速度不平衡,各省市自治区的就业条件和国家政策,就业环境不同,导致职工工资存在行业间的工资水平存在着巨大的差异,从另一个方面反映出了中国贫富差距的不断扩大。对我国就业人员职工工资的研究,对我国的社会保障政策和就业政策,教育政策等具有重要的决策意义。也为对我国经济社会的研究提供了一个因素。我国就业职工工资水平的行业间的差异已经日益成为我国政府重视的一个问题。[关键词]不同行业就业平均工资一、引言当前我国处于经济发展快速时期,由于我国人口总数较大,就业人员众多。因此,就业问题成为了我国社会的一个焦点问题。研究好行业间就业问题以及就业职工工资问题,能够有效的把握好社会状况,能够帮助大学生更准确的定位自己,找到自己满意的工作。制定正确的就业政策和社会保障,社会福利政策,来促进大学生的就业问题以及我国国民经济的发展。本文选取2013年我国各行业城镇单位就业人员平均工资的数据,主要利用以下几种统计方法进行分析:因子分析法、聚类分析法。将全国各省按照不同行业就业人数进行分类和排序,并与人们实际观察到的情况进行比较分析。因子分析是指研究从变量群中提取共性因子的统计技术。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。聚类分析是一组将研究对象分为相对同质的群组的统计分析技术,依据研究对象(样品或指标)的特征,对其进行分类的方法,减少研究对象的数目。二、数据下表是我国按行业分城镇单位就业人员平均工资的原始数据,数据来源于《2013中国统计年鉴》,X1~X19分别代表农林牧渔业、采矿业、制造业、电力热力燃气及水生产和供应业、建筑业、批发零售业、交通运输仓储和邮政业、住宿和餐饮业、信息传输软件和信息技术服务业、金融业、房地产业、租赁和商务服务业、科学研究和技术服务业、水利环境和公共设施业、居民服务修理和其他服务业、教育、社会卫生和工作、文化体育和娱乐业、公共管理社会保障和社会组织。三、分析(一)因子分析1、因子分析的适用性判定如图所示,从KMO测度来看,KMO值等于0.705大于0.5,可以做因子分析,从巴特莱特球体检验来看,其零假设是相关矩阵为单位矩阵,P值等于0,说明拒绝原假设,原始数据适合进行因子分析。上图说明因子解释原始变量方差的情况,提取了三个主成分因子,第一主成分的特征值为14.527,第二主成分的特征值为1.101,第三主成分的特征值为0.860,这三个主成分特征值的累计概率达到了86%,说明解释了原始数据86%的信息。上图为各个变量的共同度,大多数变量的共同度都达到了0.9以上,说明提取的信息较多。图为旋转前的因子载荷矩阵,旋转前各变量在各个载荷区别并不是很明显。根据Xi=a1iF1+…+aimFm+ε可以算出各公共因子的线性组合。图为旋转后的因子载荷矩阵,可以看出,电力热力、批发零售业、交通运输住宿和餐饮业、信息传输、金融业、房地产服务业、租赁、公共设施服务业、教育社会工作、卫生、体育社会保障、公共管理和社会组织对第一主成分的贡献较大,称为社会工作因子;农林牧业、采矿业、制造气燃气、建筑业对第二主成分的贡献较大,称为工农建筑业因子;居民服务、服务业对第三主成分的贡献较大,称为居民服务因子。图为主成分的得分系数矩阵,根据Fj=β1jX1+β2jX2+…+βjpXp算出各主成分的得分如下表所示。上图为各个省份的主成分得分和综合得分情况。图为主成分得分和综合得分的排名。从第一主成分来看,东部地区和东南部发达地区的得分比较高,说明这些地方的社会工作,金融服务业的平均工资比较高。从第二主成分来看,是一些经济发达的地区和资源比较丰富的地区,在经济发达的地区,制造气燃气和建筑业的平均工资的比较高,而在资源发达的地区,农林牧渔业和采矿业的就业人员的工资比较高。从第三主成分来看,也是一些经济较为发达的东部地区,说明这些地区的居民服务人员的工资水平较高。从综合得分来看,还是东部沿海地区的平均工资比较高,例外的是西藏的平均工资也比较高,当然工资比较高,所面临的就业压力和竞争也就比较大。从这个方面可以反映出来,我们大学生在选择就业地区的时候,不一定要选择工资高的地方,也可以选择一些工资适中,就业压力不是很大的地区。这些可以为我们在选择就业的时候提供一些根据。(二)聚类分析说明31个数据全部参加了聚类,而且没有缺失值。图为凝聚顺序表,表明了31个样品的聚类过程。聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1群集217181.670003214171.71100337142.95012447203.356307524273.4850014616283.567001377253.6574013822233.81300179383.89500221012303.9830019116214.8120018125295.0290016137165.0767614147245.366135181510196.0860023165156.235120191713226.650082018676.983111421195127.050161020205139.05919172421469.2370182222349.6959212523101110.120150282453111.87120025253512.726222427261915.16400292732621.394250282831032.996272330291244.657260303013140.58729280图是聚类树状图,也叫聚类谱系图,从图中不但可以看出具体的聚类过程,也可以将样品合理分类。图中从上到下可以看到,按距离的亲疏关系,首先将3,24,27,28,29并为一类,12和15并为一类,依次这样合并,最后和为三大类。结论:根据以上的图标的聚类过程,可以对原有31个省市各行业的城镇就业人口平均工资进行分类。如果粗略地将全部样品分为两大类,则第一类为中西部地区和中南部地区,第二类为东部地区和经济发达地区。说明我国各个行业之间的平均工资差异还是比较大的,在经济发达的东部地区的工资明显高于西部落后地区。如果要进一步细分,则可分为四个小组。第一组:甘肃,青海,贵州,陕西,河北,河南,山西,山东;第二组:江西,湖北,广西,四川,湖南,重庆,云南;第三组:内蒙古,吉林,辽宁,新疆,黑龙江,海南,北京;第四组浙江,江苏,福建,广东,天津,上海。第四组都属于经济最为发达的地区,其人口流量大,人口密度高,同时各个产业都相对最为发达,因此各行业的平均工资也相对较多较集中。第二组中的六个省市都来自中南部地区,因此行业结构比较类似,就业人员数也比较类似。第一组中的省市产业以农业和工业为主,服务类行业、金融、房地产行业不太发达,因此人员就业的平均工资也不算太高。第三组中的六个省市都有其最为突出的重点产业,比如海南、新疆的旅游业较为发达;内蒙古自然资源丰富,尤其是能源及矿产资源丰富,因此工业比较发达;东三省工业发达的同时其农业也比较发达;而北京是我国的政治中心和金融中心,因此在这六个省市在产业结构上有最为突出的特点,就业人员的平均工资比较高。从上面也可以看出,各个行业之间的差距还是较大的,这对于我们刚刚或即将毕业的大学生来说,也是一种对就业行业的一种指导,可以引导自己去选择适合自己的工作。四、总结通过以上两种种多元统计方法的分析,总体来说经济发达地区的平均工资也相对较多,但由于各地区产业侧重点不同就业人数有一定差异。比如,经济越发达的地区,服务业也越发达,则从事服务行业的人员也相对较多;而自然资源发达的地区。另外,通过将各省市进行分类也可以看出不同的地区有不同的产业优势,因此从事各行业的人员分布也具有一定的特点。比如个别省份有其最为突出的产业,则各行业的从业人员特点鲜明,当地特色行业的从业人数较多,而其他行业的人才可能就比较稀缺。这也直接导致了各个行业之间平均工资的差异。因此,本科毕业生在择业的时候,可以根据不同地区的特点以及工资结合自己的专业进行选择。参考文献[1]付德印:《应用多元统计分析》.北京:高等教育出版社,2013[2]何晓群:《应用多元统计分析》.北京:中国统计出版社,2010[3]中国统计年鉴2013年.中国统计出版社.
本文标题:多元统计分析报告
链接地址:https://www.777doc.com/doc-3209419 .html