您好,欢迎访问三七文档
学号:姓名:题目:摘要回归分析是应用极其广泛的数据分析方法之一。它基于观测数据建立变量间适当的依赖关系,以分析数据内在规律,并可用于预报、控制等问题。针对问题一,运用线性回归对数据进行分析,将得到的结果与显著性水平相比较,进行残差分析,得到线性回归方程的准确度以及对数据敏感度。针对问题二,运用曲线拟合模型对数据进行拟合分析。针对问题三,结合数据进行拟合,做出趋势图,得出趋势方程。一、模型的准备第一问:为确定实际投资额对国民生产总值和物价指数的依赖关系,取实际投资额为因变量y,国民生产总值和物价指数分别为自变量x1和x2.然后,进行数据描述分析。有散点图可见y线性依赖x1和x2,而且变化趋势很相似,怀疑x1与x2之间存在共线性性质,画x1-x2散点图1-1马上证实了这一点。二、模型的建立第一问:实际投资额y可以表示成其中一个自变量的函数,选择国民生产总值x=x1,取线性模型y=a+bx做回归分析。图1-2线性回归表1-1投资额与国民生产总值的回归结果参数估计值置信区间a2.8103-21.821427.4420b0.15600.14130.1707R2=0.965,F=496.9,P<0.0001.S2=583虽然,拟合优度R2接近1,F统计量概率值P<0.0001很小,但是参数估计的95%置信区间太大,而且含有零点,这意味着参数参数有可能取零值。特别是残差序列图2.1.5出现异方差现象,残差散布的范围随着序列变化增大。这与回归分析成立的前提“残差具有零均值和均方差”相矛盾。考虑到投资额和国民生产总值这些数据(xt,yt)都是来自同一个体的不同时间t的观测值,不同时间的数据之间可能存在相关性,这种相关性简称为自相关性。自相关性分析也称为自回归分析,是研究时间序列的常用方法。但不是对所有时间序列数据都可以直接进行自回归分析,希望利用过去的数据预测未来的关系,就必须假设两个变量之间未来的依赖关系与过去的有着某种相似性,统计上定义这种相似性为时间序列的平稳性。严格的说,称一个时间序列{rt}是平稳的,如果该序列满足:对任意的整数k,任意的的时间点t0,随机变量rt0,rt0+1,...,rt0+k是独立同分布的。也就是说该序列的均值和方差不会随时间的改变而变化。从上面的残差图可见,对于k=0,残差序列{rt=yt-a-bxt}的方差随时间逐渐增大,它不是一个平稳过程,自相关性也非常不好,因此不能采用自回归模型。重新考虑到作为时间序列,实际投资额对国民生产总值的依赖可能存在滞后,国民生产总值对实际投资额的部分影响可能隔几年后才显现出来。经过多次试验,得到统计分析结果最佳的模型:yt=a+b1xt-2+b2xt对这个模型进行回归分析表1-2回归分析参数估计值置信区间a25.560515.451535.6696b1-0.5698-0.6705-0.4692b20.61600.53440.6976R2=0.9962,F=1.9650,P<0.0001.S2=0.065结果表明,当年的国民生产总值与实际投资额是正相关的,前年的国民生产总值对实际投资额的影响是抑制的。根据这个模型,只要知道国民生产总值就不难估计相应时间的实际投资额。第二问:对未来投资额yt作预测,需先估计出未来的国民生产总值x1t和物价指数x2t设已知t=21时,x1t=3312,x2t=2.1938基本回归模型根据以上分析我们得到了投资额与国民生产总值及物价指数之间的多元回归方程Ù得出的结论是投资额和国民生产总值及物价指数的关系显著。第三问:为了方便分析出房地产对四川GDP增速的影响效果,就需要利用数学建模的方法对其进行定性和定量的分析。本文在评估房地产对中国GDP的影响时,正是运用了这种方法。通过四个不同的角度,分别建立模型。第一个角度是研究房地产投资总值与四川GDP总值的关系系数,比较房地产投资增速与四川GDP总值的关系。第二个角度是研究房地产开发投资总值和前一年四川GDP总值对今年四川GDP总值的贡献。第三个角度是研究房地产开发投资总值同比增长数与四川GDP总值同比增长数之间的关系,进而研究房地产投资总6720.485ˆty值的增长率与四川GDP增长率的关系。第四个角度是研究房地产开发投资同比增长率每年上升(或下降)的百分点和四川GDP增长率每年上升(或下降)的百分点之间的关系,通过这种关系我们得出房地产开发投资同比增长率每年上升(或下降)的百分点对四川GDP增长率每年上升(或下降)的百分点的影响。表3-1房地产投资额与GDP的数据房地产投资额GDP90.72443.2197.42871.65113.53241.47125.73474.09149.33649.12195.973928.2268.154293.49344.384725.01450.875333.09510.086379.63701.457385.1914.58690.241326.8310562.391451.712601.231588.3714151.282194.6317185.482819.1721026.683266.423872.8385326392.074380.0928536.66图3-1房地产投资额用线性回归模型,根据中国统计年鉴发布的相关数据对国民生产总值与房地产开发投资总值之间的关系进行线性拟合,假设二者的线性关系为m1=a*m2+b(a,b为常数系数)用MATLAB软件编程求解,用MATLAB软件编程运行得到国民生产总值与房地产开发投资总值线性相关关系图用matlab编程运算得到m1=8×m2+57306未来国内GDP增长符合上图函数,在未来十年内将保持持续增长。第四问:表4-1年份全社会固定资产投资(亿元)GDP(亿元)CPI2014512020.65635910101.62013446294.09588019102.62012374694.74534123102.62011311485.13484124105.42010251683.77408903103.32009224598.7734562999.32008172828.4316752105.92007137323.94268019104.82006109998.16217657101.5200588773.61185896101.8对GDP,全社会固定资产投资,CPI进行相关系数分析。使用Pearson相关系数进行计算计算结果:表4-1全社会固定资产投资与GDP列1列2列11列20.9906511图4-1固定资产投资与GDP关系说明两者相关性很强,且呈线性相关。表2-1CPI与GDP列1列2列11列2-0.00131说明两者没有相关性。三、参考文献[1]谭千蓉、林宗兵.数学实验与数学模型第一版.西南交通大学出版社,2009.11.[2]刘爱玉,SPSS基础教程,上海:上海人民出版社2007年[3]章文波、陈红艳,实用数据统计分析及SPSS12.0应用(第一版),北京:人民邮电出版社,2006年附录:第一问matlab程序:x1=[596.7637.7691.1756799873.4944992.71077.61185.91326.41434.21549.317181918.32163.92417.82631.72954.73073];x2=[0.71670.72770.74360.76760.79060.82540.86790.91450.960111.05751.05751.15081.25791.32341.40051.50421.63421.78421.95142.0688];y=[90.997.4113.5125.7122.8133.3149.3144.2166.4195229.8228.7206.1257.9324.1386.6423401.9474.9424.4];subplot(1,3,1),plot(x1,y,'*'),title('x1-y')subplot(1,3,2),plot(x2,y,'*'),title('x2-y')subplot(1,3,3),plot(x1,x2,'*'),title('x1-2')A=[ones(size(x1))',x1'];[d,bint,r,rint,stats]=regress(y',A);plot(r,'*'),axis([0,20,-60,60]),title('residual')A=[ones(size(x1(3:end)))',x1(1:end-2)',x1(3:end)'];[d,bt,r,rt,sts]=regress(y(3:end)',A);plot(r,'*'),grid第三问:m1=[90.997.4113.5125.7149.3195.97268.15344.38450.87510.08701.45914.51326.831451.71588.372194.632819.173266.438534380.09];m2=[2443.212871.653241.473474.093649.123928.24293.494725.015333.096379.637385.18690.2410562.3912601.2314151.2817185.4821026.6823872.826392.0728536.66];a=polyfit(m1,m2,1)z=polyval(a,m1);plot(m1,m2,'r+',m1,z,'r');
本文标题:国名生产总值
链接地址:https://www.777doc.com/doc-2553792 .html