您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 股票报告 > 基于Bp神经网络等多方法的地区GDP数据质量评估与预警研究56
基于Bp神经网络等多方法的地区GDP数据质量评估与预警研究——以华东地区为例摘要我国GDP数据真实性一直是国内外学者关注的焦点,也是核算工作实务中必须面对的难点。本文在若干假定的基础上,综合运用Bp神经网络模型、ARIMA模型、Holter_winter非季节模型,并采用地方财政收入指标作为辅助指标,选取华东地区七个省(市)作为研究样本,对地方GDP变动趋势进行了较好的拟合,据此构造GDP数据质量评价系统;结合实际工作对评估结果进行了有效分析,指出了可能存在的问题;依据评估系统试图对未来数据质量进行预警,给出了2012年若干地区的数据质量预警范围,以期对实际工作有所启示。一、引言GDP作为综合反映国民经济运行状况的主要指标,倍受各级政府和有关方面关注。然而,一直以来对GDP统计数据质量的质疑声不断,较为典型的是Rawski(2001)从能源利用效率与中国经济特征等方面出发进行分析并质疑。而在实际工作中,受我国地域广大、区域间差异大等情况影响,统计数据质量评估工作存在着评估方法简单、普适性不强等诸多问题。如何对GDP数据的真实性和协调性进行定量分析,有效评估地区经济数据的质量并及时预警,对于提高官方统计数据的权威性,进一步凸显统计数据服务经济决策的作用,具有重要的理论价值和现实意义。本文特挑选华东地区六省一市作为研究对象,由于该地区包含了我国东部、东南部沿海、中部等区域省市,因此具有一定的普适性,希望通过对华东地区GDP数据质量的探索分析,找到较为可行的质量检验办法,以期对全国范围内的数据评估研究有所助益。二、理论背景及研究综述目前,国内外学者对GDP及相关数据质量的评估主要从以下几个方面:1、从逻辑性角度评估逻辑性评估以统计指标之间形成的包含、恒等及相关性作为检验依据。孟连、王小鲁(2000)通过定性研究1988-1998年各地区与全国GDP增速统计数据的差距、对比1979-1998年价格指数与国内生产总值指数两个角度,得出全国GDP增长速度并非有完全可靠的结论;Rawski(2001)认为能源消费增长率与GDP增长率之间应保持同向且大致相同的幅度,以1997-2000年间中国实际GDP增长24.7%、而在同一时期能源消耗却下降了12.8%为例,明确提出对中国GDP增长的质疑;2、从构建计量模型角度评估计量模型评估依据相关经济或统计理论构建计量经济模型,再分析模型估计结果得出待评估的统计数据是否可信的结论。阙里、钟笑寒(2005)选取1984-2001年28个省市与GDP有重要关联的11个变量,用主成分分析、固定影响变截距模型以及分别引入地区哑变量、年份哑变量的方法,尝试地区一级的GDP增长数据的模型验证,结论表明各地区的若干基础经济变量各自相对于GDP的变化趋势符合基本经济规律;刘洪、黄燕(2009)从系统的观点出发,对1978-2004年中国GDP相关数据作回归方程,得到的学生化残差、cook统计量及w-k统计量等诊断统计量,诊断出偏离模型的样本点。3、从统计核算角度重估统计核算数据重估的思路是从统计核算的角度,以统计核算方法为依据,找出待估计统计指标在核算实践中存在的问题,尽可能多地挖掘现有数据资料来重新估算,参照估算结果评估官方公布的统计指标。针对现价服务业增加值核算中存在居民住房服务增加值被低估的问题,许宪春(2002)提出运用市场房租估算法和成本估算法所得的居民住房服务增加值的平均值重新估算居民住房服务增加值,以修正居民住房服务增加值低估对现价GDP的影响。针对中国GDP和行业增加值增长数据因价格缩减不足而可能存在高估的问题,任若恩尝试以农副产品收购价格指数、工业生产者价格指数以及消费者价格指数的服务性专门指数,分别缩减第一、二、三产业的现价增加值,得出了1986—1994年间以1985年不变价格计算的GDP总量及其组成部分,并计算该期GDP及其组成部分的实际增长率。以往的研究,或以定性分析为主,检验结果较粗略;或以评估基准的指标数据充分可信为假设进行定量分析,适用性有限;或依靠统计核算数据重新估计,搜集所需数据困难,难以解释使用不同估计方法结果差距大的原因。本文的创新之处在于,一是试图通过假定规避数据可靠性要求与质疑数据真实性间相悖的难题;二是综合运用多种模型,并结合财政收入这一辅助指标探索数据评估标准;三是利用模型进行了短期预警。三、分析方法说明与基本假定评价与预警地区GDP数据的真实性,关键在于找到检验的标准,在实际统计工作中,往往通过一些与GDP关系较大的辅助指标的变动趋势、对GDP的弹性予以判断,因此这一方法本文将予以采纳并有所发展。同时GDP样本序列普遍存在自相关性,其变动呈现一定的规律,因此我们可假定除了个别时点外,GDP序列中长期发展趋势保持一致,不会受个别数据质量问题的影响,那么时间序列的变化趋势也可作为评判数据质量的标杆之一。从这个思路出发,我们设置了三个假定,并通过分别建立Bp神经网络、ARIMA、与财政收入的协整关系等模型,拟合GDP序列的变动趋势,从而探索分析和评估华东地区的GDP数据质量。假定1:经济系统运行在时间上具有惯性,GDP具有渐进稳定变化趋势。GDP数据具有较强的自相关性,每一期GDP受到包括资本、技术进步在内的影响是逐步变化的,并影响到下一期GDP的变化。如果GDP数据质量存在问题,必然与整体趋势有明显的偏离。假定2:GDP数据可能在个别时点出现偏离,但中长期保持一定的趋势和规律。由于对数据质量进行建模评估,存在对数据可靠性要求与质疑数据真实性之间的矛盾,因此通过该假定确保用相关指标或GDP历史数据建立评估模型具备可行性。假定3:GDP指标与地方财政收入等相关指标变动趋势具有一致性,存在长期稳定关系。无论全国还是地方数据的样本,都表明二者间存在协调关系,通过该假定,可以从地方财政收入出发验证GDP的数据质量并预测,且不受地方财政收入个别时点数据可信性的影响。四、Bp神经网络、ARIMA等多方法拟合数据趋势本文的研究对象为华东六省一市的现价GDP数据,GDP包括季度数据和年度数据,考虑到年度数据发布更为权威,各级政府及公众的关注度也更高,同时也是经济分析和决策的基础,特选择各省(市)年度现价GDP数据探索评估数据质量。为避免因预测方法缺陷造成拟合趋势偏离,因此选择包括Bp神经网络、ARIMA模型、与相关变量协整模型及Holter_winter非季节模型在内的多方法对地区GDP数据进行拟合并加权,以求更为准确拟合跟踪GDP数据的变动趋势。(一)Bp神经网络模型拟合1、预测方法介绍:BackPropagation网络即多层前馈式误差反传神经网络,由输入层(input)、输出层(outputlayer)和隐含层(hidelayer)构成,每层又由若干节点(神经元)组成,上层节点与下层节点通过权连接,层与层之间的节点采用全互联的连接方式,每层节点间没有联系。该算法由Rumelhart,McClelland在1986年首次提出,预测原理是利用输出后的误差来估计输出层的直接前导层的误差,再以该误差估计更前一层的误差,逐层反馈,不断调整网络的连接权值,以使网络的输出不断地接近期望的输出。其拓扑结构如图:图1Bp神经网络模型拓扑结构图隐含层输出层输入层X1121T2T---X2XnY1Y2YnZ1Z2ZnnnT2、数据的预处理为保证输入数据的数值范围不超过隐层与输出层函数的限定范围,保证训练收敛,特对神经网络的输入和目标向量数据进行归一化处理,即通过乘以10-5,将数据变换为(0,1)取值范围内。因此,对华东地区六省一市GDP数据归一化,得到表1:表1华东六省一市GDP数据归一化结果上海江苏浙江山东福建安徽江西1990年0.00780.01420.00900.01510.00520.00660.00431991年0.00890.01600.01090.01810.00620.00660.00481992年0.01110.02140.01380.02200.00780.00800.00571993年0.01520.03000.01930.02770.01130.01040.00721994年0.01990.04060.02690.03840.01680.01320.00951995年0.02500.05160.03560.04950.02150.01810.01171996年0.02960.06000.04190.05880.02560.02090.01411997年0.03440.06680.04690.06540.02970.02350.01611998年0.03800.07200.05050.07020.03290.02540.01721999年0.04190.07700.05360.07490.03550.02710.01852000年0.04770.08550.06140.08340.03760.02900.02002001年0.05210.09460.06900.09200.04070.03250.02182002年0.05740.10610.08000.10280.04470.03520.02452003年0.06690.12440.09710.12080.04980.03920.02812004年0.08070.15000.11650.15020.05760.04760.03462005年0.09250.18600.13420.18370.06570.05350.04062006年0.10570.21740.15720.21900.07580.06110.04822007年0.12490.26020.18750.25780.09250.07360.05802008年0.14070.30980.21460.30930.10820.08850.06972009年0.15050.34460.22990.33900.12240.10060.07662010年0.17170.41430.27720.39170.14740.12360.09453、建立Bp神经网络预测模型模型选用三层BP神经网络,输入层神经元为3,即输入变量为连续3年的GDP数据;输出层神经元为1,即输出变量为1第四年的GDP预测值;隐含层神经元数量则通过网络训练结果对比确定。隐含层的激活函数为logsig,输出层的激活函数为purelin,训练参数为变学习率动量梯度下降算法traingdx。为保证既给模型预留足够的学习空间,又不因运算对计算机造成过重负担,设定网络最大训练迭代次数为10000。网络的学习精度设定为1*10-4。创建和训练Bp神经网络的MATLAB程序,依次输入七个地区的GDP归一化数据,将1990年—2007年的样本作为训练集,而将1993—2010年的样本作为训练输出。以浙江省模型的MATLAB程序为例:P=[0.0090.01090.0138;0.01090.01380.0193;0.01380.01930.0269……;0.18750.21460.2299]’T=[0.01930.02690.03560.04190.0469……0.2772]testPercent=0.20validatePercent=0.20net=newff([01;01;01],[20,1],{'logsig','purelin'},'traingdx')net.trainParam.epochs=10000net.trainParam.goal=0.0001net=train(net,P,T)其中,P内为1990-2007年的输入数据,T内为1993-2010年的输出数据。通过MATLAB不断迭代计算,各地区模型均训练收敛,训练结果如图Y:0500100015002000250010-410-310-210-11001012806EpochsTraining-BlueGoal-BlackPerformanceis9.99671e-005,Goalis0.000105001000150020002500
本文标题:基于Bp神经网络等多方法的地区GDP数据质量评估与预警研究56
链接地址:https://www.777doc.com/doc-5839241 .html