您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 基于主成分回归分析的影响河南省农民收入的因素
专业应用统计学号z1119003学院财经学院基于主成分回归分析的影响河南省农民收入的因素摘要河南省是传统的农业大省和人口大省,提高农民消费水平,历来是政府关注的重点。在新形势下,农民收入问题已不仅是单纯的“三农”问题,更是一个和国家的宏观经济形势密切相联系、甚至和国际经济变化的大环境相联系的问题。因而本文收集2000-2010年数据,运用主成分回归分析方法建立统计模型,分析影响农民收入的主要因素,得出它们对农民收入增长的贡献率,并根据定量分析结果提出符合实际情况的政策建议。关键字河南省农民纯收入主成分分析一、河南省农民收入的现状近些年,河南省农民纯收入自1990年以来是不断上升的,由1990年的527元上升到2010年的5523.73元。在农民增加的收入中,其结构发生了很大的变化,增长率也各不相同。为了分析河南农民收入的影响因素,更快地增加农民收入,使农民的消费和收入都有一个飞跃,就需要对河南省农民收入各个影响因素进行深入研究,从而确定河南农民收入主要影响因素,以便为政府制定发展农村经济、增加农民收入的政策和措施提供依据和建议。基于河南省的实际状况,促进河南省农民收入可持续增长和促进河南省小康社会的全面实现具有更重要的意义。二、指标选择及研究方法的确定(一)指标选取年份YX1X2X3X4X5X6参考相关文献资料,根据经济理论及实践研究,分析影响农民收入及其增长的主要因素,本文建立模型所选用的因变量Y是河南省农村居民家庭人均纯收入,自变量分别为河南省第一产业人均GDP(X1),第二产业人均GDP(X2),第三产业人均GDP(X3),城镇化水平(X4),农用机械总动力(X5),主要农作物播种面积(X6)。本文用于实证分析的数据是2000-2010年河南省11年的时间序列资料,见表1,原始数据来源于历年《河南省统计年鉴》和《中国统计年鉴》。(二)研究方法的确定在实际问题的研究中,为了全面分析问题,往往涉及众多有关的变量,虽然各自变量对因变量都是有意义的,但是某些自变量彼此相关,变量太多不但会增加计算的复杂性,而且也给合理分析问题和解决问题带来困难。因此,需要对回归方程中的变量进行共线性诊断,并且确定它们对参数估计的影响,利用相关性对这些变量加以“改造”,用为数较少的新变量来反映原变量所提供的大部分信息,通过对新变量的分析达到解决问题的目的。主成分分析的基本方法是通过构造原变量的线性组合来产生一系列互不相关的新变量,从中选出少数几个新变量并使它们含有尽可能多的原变量带有的信息,从而使得用这几个新变量代替原变20001985.821161.582294.151597.2623.25780.612659.9020012097.861234.342510.451788.2224.46078.713136.9020022215.741288.362678.751978.3725.86548.213127.7020032235.681198.703310.142358.8627.26953.213359.8020042253.151649.294182.102722.4028.97521.113684.4020052870.581892.015514.143181.2730.77934.213789.7020063261.031916.746724.613721.4432.58309.113995.3920073851.602217.668282.834511.9734.38718.714087.8420084454.242658.7810259.995099.7636.09429.314181.6720094806.952769.0511010.505700.9137.79817.914196.5920105523.733258.0913226.386607.8938.810195.914248.69表12000-2010河南省个指标数据量分析问题和解决问题成为可能。因此,利用主成分分析可以很好的解决回归分析中多重共线性问题。本文采用主成分回归分析方法建立模型,主成分回归的原理是用主成分分析提取的主成分与因变量回归建模。由于主成分间具有不相关性,并且能较好的反映原来众多相关性指标的综合信息,因此,用主成分作为新的自变量进行回归分析使得回归方程及参数估计更加可靠。主成分回归分析方法具体步骤为:(1)对P个自变量(经标准化处理)构成的数据表做主成分分析,得到P个主成分F1,F2,…,Fp。根据选定的累计贡献率,选取前m个主成分。(2)采用普通最小二乘法,做前m个主成分F1,F2,…,Fp对因变量Y的多元线性回归,得到回归模型mmFFFyˆˆˆˆˆ22110(3)由于每个主成分F1,F2,…,Fm均是自变量X1,X2,…Xp的线性组合,因此,经转化可得最终线性回归模型ppXXXyˆˆˆˆ2211三实证研究过程(一)相关性分析对因变量与所有自变量做相关分析,相关系数矩阵见表2。可见因变量农村居民家庭人均纯收入跟其他自变量的相关性都很强,所以,可以建立因变量与众多自变量之间的线性回归模型,模型具有合理性。(二)共线性诊断由于自变量的个数太多,而且由相关系数矩阵表也可以看出自变量之间也存在明显的相关性,这样在建立模型时就可能会出现严重的共线性。为验证是否存在多重共线性问题,首先建立因变量Y与自变量X1,X2,…,X9的多元线性回归模型。从回归结果看,调整后的判定系数R2=0.991,说明模型总体拟合效果非常好。统计量F=183.195,显示回归结果有统计学意义,但参数估计结果显示大多数回归系数并无统计学意义。从共线性诊断结果看,计算各自变量的方差扩大因子,VIF1=108.672,VIF2=487.596,VIF3=425.261,VIF4=770.684VIF5=472.549VIF6=40.017698.908,各自变量的方差扩大因子VIF均大于10,可见自变量之间存在较强的多重共线性,并且这种严重的多重共线性会影响最小二乘估计。本文采用主成分回归分析方法消除多重共线性重新建立回归模型。表2相关系数矩阵农村居民家庭人均纯收入(元)第一产业人均GDP(元)第二产业人均GDP(元)第三产业人均GDP(元)城镇化水平(%)农用机械总动力(万千瓦)农作物播种面积(千公顷)相关系数农村居民家庭人均纯收入(元)1.000.985.995.992.962.959.856第一产业人均GDP(元).9851.000.993.989.970.972.886第二产业人均GDP(元).995.9931.000.998.979.977.891第三产业人均GDP(元).992.989.9981.000.985.984.904城镇化水平(%).962.970.979.9851.000.998.959农用机械总动力(万千瓦).959.972.977.984.9981.000.957农作物播种面积(千公顷).856.886.891.904.959.9571.000(三)进行主成分分析由表3可知,特征根大于1的只有一个,所以只提取了一个主成分,此主成分的累计共贡献率是96.923%,说明这一个主成分已经反映了原来6个自变量96.923%的信息。表3总体方差解释表ComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative%15.81596.92396.9235.81596.92396.9232.1632.70999.6323.014.23199.8634.006.10299.9655.001.02299.9876.001.013100.000ExtractionMethod:PrincipalComponentAnalysis.表4因子得分系数矩阵表示主成分与自变量之间的线性关系,我们可根据因子分析与主成分分析的关系得到主成分分析载荷阵,即jijijau,可写出主成分的线性组合如下:表4因子得分系数矩阵F=0.418ZX1+0.410ZX2+0.412ZX3+0.412ZX4+0.412ZX5+0.163ZX6(四)根据主成分再进行线性回归首先,把农村居民人均纯收入(Y)进行标准化,得到ZY,然后把标准化的农村居民人均纯收入(ZY)和主成分(F)进行简单线性回归分析,得到:Y=(-1.759E-16)+0.445FT(0.000)(14.846)P(1.000)(0.000)R2=0.956通过SPSS18.0软件的分析,得到调整后的可决系数为0.956,有显著的统计学意义。再将上面的式子进行变量代换,得到:Y=3224.61+0.3137X1+0.06X2+0.1349X3+42.33X4+0.1521X5+0.408X6(五)结论分析ComponentZscore:第一产业人均GDP(元.169Zscore:第二产业人均GDP(元).170Zscore:第三产业人均GDP(元).171Zscore:城镇化水平(%).171Zscore:农用机械总动力(万千瓦).171Zscore:农作物播种面积(千公顷).163通过分析得到农村居民人均纯收入与第一产业人均GDP,第二产业人均GDP,第三产业人均GDP,城镇化水平,农用机械总动力,主要农作物播种面积之间的关系。从①中可以看出,当第一产业人均GDP增加1%,农村居民人均纯收入将增加0.3137%;当第二产业人均GDP增加1%,农村居民人均纯收入将增加0.06%;当第三产业人均GDP增加1%,农村居民人均纯收入将增加0.1349%;当城镇化水平提高1%,农村居民人均纯收入将增加42.33%;当农用机械总动力增加1%,农村居民人均纯收入将增加0.1521%;当主要农作物播种面积扩大1%,农村居民人均纯收入将增加0.408%。四、提高农民收入的建议1.加快第一产业的发展根据回归分析,第一产业人均GDP相对于第二、三产业人均GDP来说,对农民收入的增加的促进作用最大。第一产业人均GDP=第一产业GDP总量/总人口,所以增加人均GDP的方法应从两方面入手。一方面,应控制人口的数量,另一方面,应增加第一产业GDP总量。河南省一直是我国人口大省,人口基数很大,特别是在2010年已过亿,所以应适当控制人口。其次,增加第一产业人均GDP主要应增加第一产业GDP总量。根据回归分析,当主要农作物播种面积扩大1%,农村居民人均纯收入将增加0.408%。所以扩大主要农作物的播种面积可以促进农民收入的增加。如果简单的看,GDP=最终产品的价格×最终产品的产量,由于河南省是被定为农业大省,第一产业的GDP总量主要是农产品的贡献。所以提高GDP总量可以从两方面入手。从价格来看,农产品价格的提高依赖于农产品的品质,直接的方法是增加农产品的科技含量,提高产品的品质,间接的方法是增加农产品的附加值,进行农产品的深加工。从数量来看,也可以从两方面入手。一方面,通过科学技术手段提高单产,另一方面,提高抵御自然灾害的能力。2.提高城镇化水平城镇化水平的提高意味着有更多的农村人口进入到城镇中,因为城镇的各项基础设施和福利都要比乡村好,所以农民进城后无论是打工还是自主创业所获得的收入都会远远高于在农村所获得的收入。从模型中可以看到,城市化对农民收入增长的贡献很大。发达国家的经验表明,工业化进入初中期以后,农村人口城市化进程明显加快,从而使农民收入增长进入了主要通过农村人口减少来增加收入的阶段。可见,加快农村城镇化,放宽城市的农民准入条件,改善农民工进城就业的就业环境,鼓励支持有条件的民工回流创业等应该成为城市化,以及农民增收的关键。让大量农民转变为市民,成为工人、商人、企业家,农民的收入水平自然得到提高。3.提高耕地利用率从河南省统计年鉴得知,2006年河南省的耕地保有量始终稳定在1400万公顷以上,并逐年增加,但是土地面积的有限性致使耕地面积的增加不可能无限扩
本文标题:基于主成分回归分析的影响河南省农民收入的因素
链接地址:https://www.777doc.com/doc-5275259 .html