您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 我国各地区教育支出与经济增长
我国各地区教育支出与经济增长的空间计量分析参赛学校:中央民族大学参赛序号:282参赛成员:宛立杰胡洪胜陶淘2009年9月29日1摘要本文主要研究了教育支出与经济增长之间的关系。首先,用一般线性回归的方法,以各省人均GDP为因变量、人均教育经费为自变量,拟合出了不含常数项的回归模型125.1144Yx。然后,通过各省市指标分析以及Moran’sI值的计算,明确了各省市之间存在空间差异性。于是进一步用更能反映经济变量之间的空间依赖性的地理加权回归(GWR)方法,以全国30个省市为例,建立模型0(,)(,)iiikiiikikyuvuvX,1,2,i…,n,其中(,)iiuv是第i个样本点的空间坐标;利用加权最小二乘法来估计,估计出30个省市的模型参数,并就此分析了各省市之间的差异。最后比较了普通回归与地理加权回归的优劣,得出了教育支出促进经济增长,不同地区间促进的效果不同的结论。关键词:最小二乘法(OLS)空间计量经济Moran’sI地理加权回归(GWR)教育经济增长2一研究背景及相关理论(一)国内外相关研究关于教育与经济数量关系的研究,美国经济学家沃尔什早在其1935年出版的《人力资本观》一书中,就通过个人教育费用和个人收益比较计算教育的经济效益,该书被认为首次正式提出了“人力资本”的概念。一般认为人力资本包括了教育、健康、社会关系等方面,但由于教育与经济增长的关系较为明显,以及为了简化问题的分析,国内外大量的实证研究直接将有关教育的指标作为人力资本的代理变量。人均教育投资、人均受教育年限、教育注册率等通常作为教育因素引入为解释变量,而人均GDP、GDP增长率等指标则代表生产力水平和经济状态作为被解释变量。在模型选取上主要用线性模型或可线性化模型(广义),如以柯布———道格拉斯函数为基础的多解释变量模型,或者直接把经济变量对教育指标进行回归。由于后者相对简便,而且为了避免因同时考虑众多变量,可能会产生解释变量部分重叠而淡化教育与经济的数量关系,大多数实证研究采用经济变量直接对教育变量回归建模。关于教育与经济数量关系的研究,通常更注重对时间序列数据的分析。但由于我国在统计方面与国际接轨起步较晚,往往会面临数据期限较短等方面的问题,同时,时间序列分析忽略了地区差异,大量的区域信息得不到应有的利用。在这种情况下,人们考虑对截面数据的分析。长期以来,在主流的经济学理论中,空间事物无关联及均质性假定的局限,以及普遍使用忽视空间效应的普通最小二乘法(OLS)进行模型估计,使得在实际应用中往往存在模型的设定偏差问题,进而导致经济学研究得出的各种结果和推论不够完整、科学,缺乏应有的解释力。经典计量经济学中的线性回归模型的经典假定,以及回归模型的系数β是一个常数假定,面对异常复杂的经济系统和因素变量之间的交互影响,尤其是碰到横截面数据之间存在空间自相关性和空间异质性时,经典计量的线性回归模型就显得有些力不从心,需要发展新的方法来弥补这种不足。【1】空间计量经济学(Anselin,1988)理论认为,一个地区空间单元上的某种经济地理现象或某一属性值与邻近地区空间单元上同一现象或属性值是相关的。几乎所有的空间数据都具有空间依赖性或空间自相关性的特征,空间依赖的存在打破了大多数经典统计和计量分析中相互独立的基本假设。也就是说,各区域之3间的数据存在与时间序列相关、相对应的空间相关。空间统计和空间计量经济方法是在继承和发展完善经典统计和计量方法的基础上,将经典统计和计量方法应用于与地理位置及空间交互作用相关的地理空间数据,通过地理位置与空间联系建立的统计与计量关系,以统计和计量方法识别和度量空间变动的规律与空间模式的决定因素。(二)空间经济计量学介绍空间统计和空间计量经济学理论与方法继承和发展了经典统计和计量理论方法,将经典统计和计量方法应用于与地理位置及空间交互作用相关的地理空间数据,通过地理位置与空间联系建立统计与计量关系,以统计和计量方法识别和度量空间变动规律及空间模式的决定因素。空间经济计量学主要研究存在空间效应的问题。空间效应主要包括空间相关和空间差异性。在研究中涉及空间相邻、空间相邻矩阵等概念。1.空间相关空间相关指在样本观测中,位于位置i的观测与其它j≠i的观测有关,即存在空间相关的原因有两方面:相邻空间单元存在测量误差,空间交互影响的存在。测量误差是由于调查过程中,数据的采集与空间中的单位有关,如数据是按盛市、县等统计的,但设定的空间单位与研究问题不一致,存在测量误差。空间相关不仅意味着空间上的观测缺乏独立性,并且意味着潜在于这种空间相关中的空间结构,也就是说空间相关的强度及模式由绝对位置和相对位置(布局,距离)决定。2.空间差异性空间差异性指空间上的区域缺乏均一性,如存在中心区和郊区、先进和后进地区等。例如,我国沿海地区和中西部地区经济存在较大差别。对于空间差异性,只要将空间单元的特性考虑进去,大多可以用经典经济计量学方法解决。但当空间差异性与空间相关共同存在时,经典经济计量学方法不再适用,而且这时问题可能变得非常复杂,因为这时要区分空间差异性与空间相关可能非常困难。3.时空数据空间模型在模型中考虑时间维增加了描述的复杂性,但综合时间空间的模型在实际工作中非常有用。在经典的经济计量学模型中,这是综合截面和时间序列数据的情形。如果数据不存在空间相关,则可以采用PanelData模型。Anselin(1988)将4似不相关(SUR)模型扩展到空间的情形,提出空间SUR模型。【2】(三)我国的基本国情我国不同地区,在经济、科技,文化等方面差异较大,因此教育投资发展水平也有比较大差异。由于我国经济发展水平与发达国家相比还较低。用于教育投资的数额有限,国家对各地区的教育投资总规模不同。此外.我国在各区域教育投资结构不同。根据国家教委统计资料,我国在“十五“期间全国30个省,市.自治区地方财政性教育经费占GNP比例存在明显差异.反映了我国各区域之间教育发展相对平衡性与社会经济发展水平的不平衡性的突出矛盾,教育投资水平与社会经济发展水平的不协调性在教育经济发展欠发达地区尤为突出。在理论研究实证方面,郑丽琳(2006)将全国分为东、中、西部三大区域,采用1996年~2002年数据.运用面板数据模型进行分析。结果模型表明,教育投资对我国东,中.西部三个地区经济发展的促进作用各有不同,差别较大,东部最为明显,而中西部明显偏低。目前,产生教育投资效应区域差别的原因主要是国家在各区域投资规模和结构的不同。然而.在和谐社会建设和“十一五”规划下.我国各地政府对教育投资加强了重视程度和支持李度。【3】(四)回归分析【4】1.回归模型变量Y与其他有关变量1X,2X,…,kX的关系12(,,)kYfXXX…,称为“回归模型”,其中为均值为0的随机变量。模型中的变量Y称为因变量或“响应变量”,通常建立回归模型的目的是要说明因变量的变化规律,并对其进行预测;模型中的变量1X,2X,…,kX称为自变量或“解释变量”,用来说明或解释因变量。当f为线性函数时,回归模型:01122kkYXXX…称为线性回归模型,特别的k=1时称为一元线性回归模型。2.线性回归模型(LineRegressionmodel)线性回归模型的一般形式为:01122kkYXXX…式中,01,,k…,是未知的参数;是不可观测的随机变量,称为误差项,假定2~(0,)N。如果有n次独立的观测数据12(,,;)iiikixxxy…,1,2,i…,n,则线性回归模型可以表示成如下形式:51011121211201212222201122kkkknnnknknyXXXyXXXyXXX……?……式中,12n,,…,相互独立且服从2(0,)N分布。上式可以简写成如下矩阵形式:YX式中12nyyYy,111k212k1nkxxxxx11x1nX………,12k,12n3.参数与2的估计若X的秩rank(X)=k+1n,参数的最小二乘估计为1(')'XXXY可以证明,为的无偏估计。当给出的的估计=10(,,)'k…,后,将其代入回归模型中并略去误差项,得到的方程01212kkYXXX…称为回归方程。利用回归方程可由12,,kXXX…,得观测值求出因变量Y的估计值(预测值)。预测值与实际值的关系是:1(')'YXXXXYHY式中,1(')'HXXXX。称()YYIHY为残差向量,简称为残差,其中I为n阶单位矩阵。称21'()niiiSSEyy为残差平方和。若rank(X)=k+1n,均方残差(MSE):211sSSEnk即为误差的方差(也是实测值Y的方差)2的无偏估计,均方残差有时也称为均方误差。64.有关统计量及回归方程的拟合优度给定因变量Y与自变量12,,kXXX…,的n组观测值,就可以利用上述方法得到未知参数与2的估计,从而可以给出回归方程:01212kkYXXX…残差平方和(errorsumofsquares):21'()niiiSSEyy反映了出去Y与12,,kXXX…,之间的线性关系以外的因素引起的数据12n,,yyy…,的波动。若SSE=0,则每个观测值可由线性关系精确拟合,SSE越大,观测值与线性拟合值的偏差也越大。模型平方和(modelsumofsquares):21()niiSSMyy反映了拟合值与其平均值的总偏差,即由变量12,,kXXX…,的变化引起的12n,,yyy…,的波动。若SSM=0,则每个拟合值均相等,即(1,2,n)iyi…,不随12,,kXXX…,的变化而变化,这实质上反映了12k0…。总变差平方和(totalsumofsquares)21()niiSSTyy反映了数据12n,,yyy…,波动性的大小。可以证明SSTSSMSSE。因此,SSM越大,说明由线性回归关系描述的12n,,yyy…,波动的比例就越大,即Y与12,,kXXX…,之间的线性关系就越显著。判定系数(determinationcoefficient):21SSMSSERSSTSST可以解释为12n,,yyy…,的总变化量SST中被线性回归方程所描述的比例。2R越大,说明该回归方程描述因变量总变化量的比例越大,从而拟合的误差平方和SSE就越小,即拟合效果越好。可见2R反映了回归方程对数据的拟合程度,是衡量拟合优劣的一个很重要的统计量。5.显著性检验回归分析的主要目的是根据所建立的回归方程,用自变量12,,kXXX…,的值估计或预测因变量Y的值。建立了回归方程后,还不能马上进行估计和预测,7因为该方程是根据样本数据得到的,它是否真实放映了12,,kXXX…,和Y之间的关系,需要检验后才能证实。显著性检验主要包括两个方面的内容:一是回归方程的检验,二是回归系数的检验。6.回归诊断确定所选择的回归模型是否能够恰当地拟合所研究的数据称为回归诊断。在拟合一个回归模型之前,并不能肯定这个模型适用于所给数据。诸如对回归函数的线性假设、误差的正态性和同方差假设等,都有可能不适合所给数据。因此,拟合一个模型之后,再进一步考察模型对所给数据的适用性,是将此模型应用于实际之前所必须的,而且也是十分重要的环节。对回归模型进行回归诊断的方法有很多,最重要的方法是残差分析和共线性诊断(对多元的情况)。7.利用回归方程进行预测利用回归方程对因变量的取值进行预测分为点预测和区间预测。点预测是根据回归方程自变量的值,得到对应因变量的预测值,而区间预测则是在点预测的基础上,返回给定显著水平下的因变量的预测区间。其中,假设通过检验的“最
本文标题:我国各地区教育支出与经济增长
链接地址:https://www.777doc.com/doc-4371075 .html