您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 基于回归分析和主成分分析的中国经济分析
1基于回归分析和主成分分析的中国经济分析和评价一.调查研究的背景和现实意义当前我国的经济正处在金融危机之后的恢复期,经济增长速度依旧保持在了8%左右,这是一个很好的先兆。但是我们也应该看到存在很多的隐患,比如经济结构不合理等。而且各地都在以国内生产总值为考核经济的唯一指标,大力的推崇GDP,忽视了社会和经济发展的其他方面,很多地方的经济增长还是以牺牲环境和资源为代价,并没有重视可持续发展的重要性。所以有必要建立一套经济的综合评价指标。本文为所选取的数据都是我国宏观经济中的一些数据,而且是表征经济发展程度的一些指标。主要包括:国内生产总值,消费者价格指数,就业人口数,固定资产投资,能源生产总量,财政收入,财政支出,工业总产值,社会消费品零售总额,货物进出口总额,国内旅游收入,卫生总费用,教育总计经费。这些都是反映国民经济的宏观指标,对于经济分析有很大的作用。这次研究也是为了对影响我国经济的重要因素进行分析,以期对我国的经济发展提供一些参考。本报告的数据来源于中国国家统计局网站,数据主要包括1991-2008年的数据(国内旅游收入,卫生总费用,教育总计经费有部分缺失数据,这部分数据无法得到)。具体的数据见后面的附件。二.调查方案的设计本次报告的写作共分为三个部分。首先是确定研究主题,收集数据;其次是对数据进行分析,结合数据的特点和实际需要,我们选择回归分析和主成分分析;再次是根据分析结果,进行报告写作。报告的目的:找出影响国内生产总值的主要影响因素;建立经济的综合评价指标,特别是每个省的经济评价以及全国的经济评价。三.数据分析1.描述统计由于本文的数据都是离散数据,而且数据样本数为18,比较小,数据分组没有太大意义,所以描述统计没有选择直方图等图表来表示,选择的是均值,标准差以及偏度、峰度,经过整理后的表如下:样本数均值标准差偏度峰度国内生产总值(亿元)18116161.494579942.919241.031(右)0.437(尖顶)消费者价格指数18105.2226.90931.640(右)2.317(尖顶)就业人口数(万人)1869862.676556.924-0.684(左)-1.041(平顶)固定资产投资(亿元)1850370.76047778.11561.449(右)1.395(尖顶)能源生产总量(万吨标准煤)18153883.0947386.3851.103(右)0.011(尖顶)财政收入(亿元)1818871.083917026.340941.369(右)1.181(尖顶)财政支出(亿元)1820125.028317101.868421.216(右)0.861(尖顶)工业总产值(亿元)18179407.56129750.2531.153(右)1.160(尖顶)建筑业总产值1819096.910317775.476431.230(右)0.681(尖顶)社会消费品零售总额(亿元)1843841.89427614.03650.884(右)0.308(尖顶)货物进出口总额(亿元)1860153.44655729.23271.151(右)0.032(尖顶)2国内旅游收入(亿元)153875.86202295.102850.892(右)0.095(尖顶)卫生总费用(亿元)135846.3142797.17480.675(右)-0.514(平顶)全国总计教育经费情况(亿元)174406.89663368.849280.969(右)0.161(尖顶)通过上表我们可以对数据有一个大概的了解,上述的偏度和峰度列里标明了对应的数据是右偏还是左偏,是尖顶峰度还是平顶峰度。2.相关分析为了后文对数据进行回归分析以及考察数据之间的数量关系,为数据统计做准备,先进行相关分析,在进行相关分析的时候,考虑的是Pearson相关系数,而且主要考虑的是国内生产总值与其他因素的关系,具体的表格如下:(a=0.01)国内生产总值固定资产投资消费者价格指数就业人口数能源生产总量财政收入财政支出工业总产值建筑业总产值社会消费品零售总额货物进出口总额国内旅游收入卫生总费用全国总计教育经费情况相关系数0.986-0.3060.8440.9830.9920.9950.9710.9950.9980.9860.9920.9930.996P值.000.217.000.000.000.000.000.000.000.000.000.000.000从上面的表格可以看出来:国内生产总值与消费者价格指数不相关,与其他的变量都是显著正相关的(p0.01),这说明除了消费者价格指数外,其他的变量与国内生产总值有密切的联系,在某种意义上也可以说这些变量的增加也可以增加国内生产总值。由于后文要考虑经济发展的总体情况,这里将其他变量的相关性做简单描述:消费者价格指数与就业人口显著正相关,与其他变量不显著相关;除了消费者价格指数,其他变量之间都是显著正相关的。其中固定资产投资和就业人口数与其他的变量之间都是显著正相关的(省略输出表格)3.回归分析本文选取的因变量是国内生产总值,自变量为其他13个数据。通过做散点图可以得知国内生产总值与除消费者价格指数外的其他变量存在线性相关,所以考虑线性回归分析。由于线性回归分析要考虑多重共线性、异方差性和序列相关性等三大问题,因此经过不断的实验之后,采用向前准则,进入的自变量为固定资产投资和就业人口数的时候,输出结果为:(输出图表省略)R2=0.998(调整后为0.995),说明方程有较好的拟合度该模型的DW统计量为2.466,因为模型的a=0.05,n=18,k=3,而查杜宾-沃森检验临界值表可知:当n=18,k=3时,DL=1.05,DU=1.53,此时DU=1.53DW=2.4664-DU=2.47拒绝存在序列相关性的原假设,回归方程不存在序列相关性。方差分析显示:统计量F=1528.988,双侧P=00.05,回归方程有统计学意义。3模型的输出结果为:模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF(常量)固定资产投资(亿元)就业人口数(万人)-129787.37828426.229-4.566.0011.370.042.87132.451.000.4522.2132.546.419.1636.071.000.4522.213此时的方差膨胀因子VIF=2.21310,不存在多重共线性问题固定资产投资和就业人口的偏回归系数t统计量分别为32.451,6.071,都满足双侧P=0.0000.05,说明回归方程选取这两个变量是有统计学意义的,进入回归方程是合理的。则采用标准化的回归系数的回归方程为:Y=0.871X1+0.163X2-129787.378(Y为国内生产总值,X1为固定资产投资,X2为就业人口)4.主成分分析由于通过上文的分析我们可以看出很多指标是存在很大程度的相关的,所以说可以运用降维的思想来减少变量的个数,从而能够更好的对我国的经济进行分析和评价。所以我们采用主成分分析的方法来构造评价函数,对我国的经济进行评价,也可以对各个省的经济进行评价和排序。由于SPSS软件不可以直接做主成分分析,所以先做因子分析。在这之前,先做一下数据的处理,由于消费者物价指数对于经济来说,并不是个正向指标,因为消费者物价指数越高表明通货膨胀越高,消费者的实际可支配收入就越低,为了保持评价函数的一致性,我们将消费者物价指数这个变量重新计算为:消费者隐形收入=10000/消费者物价指数。系统输出的结果如下:(输出图表省略)当提取一个主成分时,方差累计贡献率达到了89.1%,但是消费者隐形收入这个变量的因子载荷较小(0.212);当提取两个主成分时,方差累计贡献率达到了98.2%,而且消费者隐形收入这个变量的因子载荷较大(0.972),这样两个主成分就反映了所有变量的信息,是合理的。Spss软件显示的初始因子载荷矩阵如下所示:(经调整)指标国内生产总值就业人口数固定资产投资能源生产总量财政收入财政支出工业总产值建筑业总产值社会消费品零售总额货物进出口总额国内旅游收入卫生总费用全国总计教育经费情况消费者隐形收入成份10.9980.8530.9860.9640.9950.9980.9390.99610.9860.990.9980.9990.2122-0.0490.487-0.129-0.203-0.074-0.020.011-0.0780.006-0.1410.0390.035-0.0280.972上述为初始因子载荷矩阵(A),根据性质“主成分相应特征根的平方根与特征向量的乘积为4因子载荷量,即()()ijppijjppAau则可以求出特征向量/ijijjua进而建立主成分表达式1piijjiFux1,2,im运用上面的方法可以求得特征向量u1=(0.283,0.242,0.279,0.273,0.282,0.283,0.266,0.282,0.283,0.279,0.28,0.283,0.283,0.06)u2=(-0.043,0.43,-0.114,-0.18,-0.065,-0.018,0.01,-0.069,0.005,-0.125,0.035,0.031,-0.025,0.86)则主成分表达式为:F1=0.283X1+0.242X2+0.279X3+0.273X4+0.282X5+0.283X6+0.266X7+0.282X8+0.283X9+0.279X10+0.28X11+0.283X12+0.283X13+0.06X14F2=-0.043X1+0.43X2-0.114X3-0.18X4-0.065X5-0.018X6+0.01X7-0.069X8+0.005X9-0.125X10+0.035X11+0.031X12-0.025X13+0.86X14通过主成分分析,选择两个主成分,以每个主成分的方差贡献率作为权数,构造综合评价函数:Y=0.891F1+0.091F2有了这个评价函数,就可以对我国的经济进行评价。最主要的是可以对各个省份的经济进行评价,并且对经济的薄弱环节进行加强,以促进经济的发展。以1991年到2008年为例,可以得出综合得分分别为:58993.5564819.3674569.6290669.86105778.15116038.84121887.98127755.02134569.43158089.61170375.60186124.14214167.73244298.44254150.86316728.47378109.67440238.82我们可以说经济发展良好。同样的道理,我们也可以对各个省的经济进行评价,这里省略。四.结论以及相应的建议通过上面的数据分析,我们可以看出:我国的经济发展是相当快的,而固定资产投资、能源生产量等12项指标(除了消费者价格指数外)对国内生产总值都有促进作用。而且由其他的相关分析可以看出:固定资产投资可以增加就业人口,扩大能源生产总量,扩大财政收入和国内旅游收入,增加工业总产值和建筑业总产值,而且对社会消费品零售总额和货物进出口总额的增加也有促进作用,增加卫生总费用和教育总费用。就业人口的增加也可以增加国内生产总值,财政收入和国内旅游收入,增加社会消费品零售总额和货物进出口总额,也相应了提高了卫生总经费和教育总经费。而由回归分析我们可以看到进入国内生产总值影响因素的是固定资产投资和就业人口数,它们是国内生产总值的重要影响因素。所以国家应该加强固定资产投资和增加就业人口,应该制定政策扩大固定资产投资和就业,虽然国家现在很重视就业,但是从财政支出和国家的支持力度上来看,并没有达到理想的结果。而由主成分分析,我可以看出评价函数里各个变量所占的权重相差不大,这说明经济综合评价不能简单的以国内生产总值来衡量,而应该多方面的考虑,这样才能对经济有一个宏观的了解,而且能够加强经济的薄弱环节,从而更好的发展经济。最终的建议就是加大固定资产投资和促进就业,利用经济综合评价方法评价全国的经济和各省份的经济发展状况,以实现我国经济的可持续发展。五.附件5下面
本文标题:基于回归分析和主成分分析的中国经济分析
链接地址:https://www.777doc.com/doc-2574497 .html