您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 31个省经济发展情况因子分析
广东财经大学金融学院金融硕士课程论文31个省级行政单位经济发展水平的因子分析课程名称经济应用软件姓名王学号班级14金融广东财经大学研究生课程考试(论文形式)评阅纸研究生姓名成绩评阅人签名:评语:说明:每篇论文前均需附有此评阅纸。研究生处制1摘要经济发展水平是指一个地区经济发展的规模、速度和所达到的水准。本文选取我国31个省级行政单位的的相关数据,数据包括GDP、城镇居民可支配收入、农村居民可支配收入、进出口总额、财政收入、人均存款和汽车保有数。利用因子分析方法研究31个省级行政单位的经济发展水平状况,得出各省级单位经济发展水平的因子得分并进行排名。最后,就研究结果所反映的问题给出了一些针对性的建议。关键词:经济发展;因子分析;因子得分2引言纵观我国几十年的经济发展的历史,可以骄傲的说这是一个奇迹,中国的综合国力显著提高,国家整体国际竞争力排名世界前列。中国这条巨龙终于开始腾飞。然而,我国经济发展过程中存在的一些问题也开始慢慢浮现。相对于东部来说,中西部的经济发展十分缓慢,由于地理环境差异、改革开放后政策向东部倾斜以及中西部地区自身的问题等,我国各省之间的经济发展水平不平衡问题越来越突出。因此,研究我国各省经济发展水平的意义就显得十分必要,对我国经济的协调发展具有重大的现实意义。本文选取全国31个省、市、自治区、直辖市的的相关数据,数据包括GDP、城镇居民可支配收入、农村居民可支配收入、进出口总额、财政收入、人均存款和汽车保有数。利用因子分析方法进行问题的研究。因子分析就是以最少的信息丢失为前提,将众多的原有变量综合成少数几个综合指标。人们在对某一现象进行观测时,往往会得到大量指标或变量的观测数据,这些数据在带来现象的的有关信息时,也会给数据的分析带来了一定困难;另一方面,这些众多的变量之间可能存在着相关性,实际测到的数据包含的信息有一部分可能是重复的。因子分析就是在尽可能不损失信息或者少损失信息的情况下较少为少数几个潜在的因子,这几个因子可以高度概括大量数据中的信息,这样一来,既减少了变量个数,又能再现变量之间的内在联系。例如,服装厂做衣服需要掌握人身体各部位的尺寸:衣长、裤长、臂长、袖长、肩宽等,这些指标因人而异,都是一些随机变量,但是这些随机变量之间又存在明显的联系,服装厂在生产衣服时不可能真正做到“量体裁衣”,他们需要从这许多指标中概括出少数几个关键性指标,然后依据这些指标进行加工,这样生产出来的衣服就能适合大多数人的体型。这些少数几个指标虽然不能反映人的体型的全部信息,但是却高度的概括和集中了绝大部分信息。一、研究过程1、基本描述统计分析常见的基本猫叔分析大致可以分为两大类:第一,刻画集中趋势的描述性统计量;第二,刻画离散程度的描述性统计量。集中趋势是指一组数据向某一中心值靠拢的倾向。计算刻画集中趋势的描述性统计量正是要寻找能够哦反映数据一般水平的“代表值”和“中心值”。均值是一种常用的代表值和中心值,又称算术平均数,在统计学中占有重要地位,反映某些变量所有取值的集中趋势或平均水平。离散程度是指一组数据远离其中心值的程度,常用的刻画;离散程度的描述性统计量有极值、样本标准差和样本方差。本文进行描述性分析时选取的指标有:极大值、极小值、均值、标准差和方差。软件设置及运行结果如下:3图1基本描述统计量选择窗口图2基本描述统计分析结果图2可知,31个省级行政单位GDP的极小值是920.8亿元,最大值为67792.24亿元,均值为22073.1413亿元,标准差为16986.3,离散程度较大,说明我国各省市经济发展水平很不均衡。农村居民人均可支配收入的极小值为5736.00,极大值为21192.00,均值均值为10885.0968,农村居民人均可支配收入的最高值是最低值的3.7倍,说明我国各省农村居民贫富差距很大。其他各变量的分析与之类似。2、因子分析因子分析就是以最少的信息丢失为前提,将众多的原有变量综合成少数几个综合指标。本文的因子分析如下:4(1)考察原有变量是否适合因子分析首先考察收集到的原有变量之间是否存在一定的线性关系,是否适合采用因子分析方法。文章借助变量的先关系数矩阵、巴特利特球度检验和KMO检验方法进行分析。图3变量的相关系数矩阵图3是各个变量的相关系数矩阵。可以看到大部分相关系数都较高,各变量呈较强的线性关系,能够从中提取公共因子,说明变量适合进行因子分析。图4KMO和Bartlett的检验结果图4给出了KMO和Bartlett的检验结果,由图知,巴特利特球度检验统计量的观测值为316.456,相应的概率p值接近0.如果显著性水平为0.05,由于概率p小于显著性水平,应拒绝零假设,认为相关系数矩阵与单位阵有显著差异。同时,KMO值为0.713,根据Kaiser给出的KMO度量标准可知,原有变量适合进行因子分析。(2)提取因子本文首先进行尝试性分析。根据原有变量的相关系数矩阵,采用主成分分析法提取因子,并选取特征值大于1的特征根。分析结果如图5.5图5因子分析初始解图5是因子分析初始解,显示了所有变量的共同度数据。第一列是因子分析初始解下的变量共同度,它表明对原有9个变量,如果采用主成分分析方法提取所有特征值,那么原有变量的所有方差都可被解释,变量的共同度均为1.第二列是在按指定提取条件(特征根大于1)提取特征指时的变量共同度。从该表可以看出因子分析的变量共同度都非常高,都达到了0.8以上。表明变量中的大部分信息均能够被因子所解释,各个变量的信息丢失都较少,说明本文因子分析的结果是有效的。图6因子解释原有变量总方差的情况图6是因子解释原有变量总方差的情况。第一列是因子编号,以后三列组成一组,每组中数据项的含义一次为特征值、方差贡献率和累计方差贡献率。第一组数据项描述了城市因子解的情况。第一个因子的特征值为4.855,解释原有7各变量总方差的69.352%,累计贡献率为69.352%。第二个因子的特征值为1.604,解释各变量总方差的22.916%,累计贡献率为92.268%。其余含义与之类似。第二组数据项描述了因子解的情况。由图知,由于指定提取两个因子,两个因子共解释了原有变量总方差的92.268%。说明总体上原有变量的信息丢失较少,因子分析结果理想。第三组数据项描述了最终因子解的情况。由图知,因子旋转后,累计方差贡6献度提高了,由48.084%提高到了92.268%,使得因子分析效果更加理想。图7因子的碎石图图7是因子的碎石图,横坐标为引子数目,纵坐标为特征值。可以看到,第一个因子的特征值很高,对解释经济发展的贡献最大。第三个以后因子特征值都很小,对经济发展的解释可以户略。因此提取两个因子是合适的。图8因子载荷矩阵图8是因子载荷矩阵,是因子分析的核心内容。由图知,所有变量在第一个因子上的载荷都很高,意味着它们与第一个因子的相关程度高,第一个因子很重7要。城镇居民可支配收入和人均存款数两个变量在第二个因子上的载荷较高,意味着它们与第二个因子的相关程度较高。(3)因子的命名解释这里采用了方差最大法对因子载荷矩阵实施正交旋转以使因子具有命名解释性。指定按第一因子载荷降序的顺序输出旋转后的因子载荷以及因子载荷图。分析结果如下:图9旋转后的因子载荷矩阵图9给出了旋转后的因子载荷值,由图可知,人均存款数、城镇居民可支配收入、农村居民可支配收入三个因素在第二个因子上具有较高的载荷,第2个因子主要解释了这三个变量,可以解释为居民收入情况。其他变量在第一个因子上的载荷很高,第1个因子主要解释了这几个变量,可以解释为政府收入。图10因子旋转中的正交矩阵8图11旋转后的因子载荷图图11是旋转后的因子载荷图,由图可知,人均存款量、城镇居民可支配收入、农村居民可支配收入、汽车保有数、GDP比较靠近坐标轴,说明可以用第一个因子刻画汽车保有数、GDP,可以用第二个因子刻画人均存款量、城镇居民可支配收入、农村居民可支配收入。图11因子协方差矩阵图11是两因子的协方差矩阵。由图可知,两因子没有线性相关性,实现了因子分析的目标。(4)计算因子得分本文采用回归法估计因子得分系数,并输出因子得分系数。运行结果如下:9图12因子得分系数矩阵图12是因子得分系数矩阵,由图可得出因子得分函数:F1=0.353GDP-0.074城镇居民可支配收入-0.089农村居民可支配收入+0.194进出口总额+0.265地方财政收入-0.152人均存款+0.358汽车保有数。F2=-0.134GDP+0.340城镇居民可支配收入+0.345农村居民可支配收入+0.062进出口总额-0.002地方财政收入+0.388人均存款-0.161汽车保有数。通过因子分析可以得到因子得分情况,并计算各个省级行政单位的经济发展水平的总得分,用方差贡献率作为权数计算各省市的得分,因子模型为:F=0.7516F1+0.2484F2根据上面的模型,来计算各个省级行政单位的经济发展水平的总得分,并进行排名(见表1)。因子得分大于零表式该省市经济发展水平高于全国的平均水平,而得分小于零则表示该省市的经济发展水平低于全国的平均水平。从因子得分表我们可以看出,广东、江苏、山东、浙江、北京、上海、河北、河南、四川、辽宁、福建等省市的经济发展水平高于全国的平均水平,而其余省份经济发展水平低于全国的平均水平。省份F1F2F排名广东3.245095890.11764992.4682383061江苏2.294836490.397704911.8235890062山东2.18363223-0.562742431.5014327643浙江0.881789151.461413541.0257678484北京-0.426142223.217796810.4790122355上海-0.487579623.184848630.4246515576河北0.66460387-0.580126310.3554128937河南0.73364624-0.797485550.353313103810四川0.49002998-0.621424240.2139447529辽宁0.136669090.256822380.16651516710福建-0.079637210.316621510.01879345611湖北0.05708201-0.31154089-0.03448391812湖南0.08020922-0.41053128-0.0416907213天津-0.619541891.22413762-0.161571914安徽-0.07251059-0.43942633-0.1636524615内蒙古-0.33883969-0.06691886-0.27129455616陕西-0.22859044-0.41084196-0.27386171817云南-0.19236933-0.69820849-0.31801977718山西-0.34771781-0.2550479-0.32469860419江西-0.34460322-0.35799511-0.34792976520重庆-0.45758876-0.11080553-0.37144780621广西-0.32469661-0.52800348-0.37519803722黑龙江-0.41566216-0.34395104-0.39784911823吉林-0.52858035-0.22400467-0.45292375124新疆-0.570989-0.48704444-0.55013717125贵州-0.47839205-0.78842204-0.555403526甘肃-0.70242152-0.79914212-0.72644691727海南-1.04111415-0.0753215-0.80121125628宁夏-1.03896048-0.25338576-0.8438237229青海-1.03350595-0.44356803-0.88696537130西藏-1.03816816-0.61104429-0.93207059131表1各省的因子得分二、研究结论本文利用
本文标题:31个省经济发展情况因子分析
链接地址:https://www.777doc.com/doc-2918282 .html