您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 财政收入和国家生产总值之间的一元线性回归分析
成绩评定表学生姓名王柳班级学号1309050109专业应用统计学课程设计题目财政收入和国家生产总值之间的一元线性回归分析评语组长签字:成绩日期2015年7月1日课程设计(论文)任务书学院理学院专业应用统计学学生姓名王柳班级学号1309050109课程名称数理统计课程设计课程设计(论文)题目财政收入和国家生产总值之间的一元线性回归分析设计要求(技术参数):通过该课程设计,使学生进一步理解数理统计的基本概念、理论和方法;初步掌握Excel统计工作表在数据整理中的应用,spss、matlab统计软件包作常见的统计检验和统计分析;具备初步的运用计算机完成数据处理的技能,使课堂中学习到理论得到应用。设计任务:1.数据整理:收集数据,录入数据,画出相应图形(如分布图、直方图、盒状图等)。2.一元线性回归模型:回归系数的估计与检验,数据散点与回归直线的图示,残差图。运用spss统计软件,对给定的数据拟合回归方程,做出预测。3.单因子方差分析:建立数学模型,运用spss统计软件,解算模型,做出检验,能对结果进行简单分析。计划与进度安排:第一周:周三7~8节:选题,设计解决问题方法,周四1~6节:调试程序第二周:周三1~8节:答辩,完成论文。指导教师(签字):张玉春2015年6月12日专业负责人(签字):2015年7月16日主管院长(签字):2015年7月17日I摘要现实世界中,经常出现一些变量,他们相互联系相互依存着,他们之间存在着一定的关系,数理统计中研究变量之间的相互关系的一种有效方法是回归分析。对于一元线性相关关系,用线性方程大致描述变量之间的关系,按最小二乘法求位置参数的估计值,最终求得线性回归方程找到变量之间的关系。这些复杂的步骤在spss中可简单实现。本文通过运用spss线性回归的方法对我国财政收入和国内生产总值的关系进行回归分析,求解线性回归方程,并通过方差分析和相关系数检验进行显著性检验。了解了影响国内生产总值的因素与其实质关系。本文利用概率纶与数理统计中的所学的回归分析知识,根据1992~2006年财政收入和生产总值的数据建立数学模型,利用这些数据做出国内生产总值x关于财政收入y的线性回归方程,并SPSS软件对验数据进行分析处理,得出线性回归系数与拟合系数等数据,并用F检验法检验了方法的可行性,同时用分布参数置信区间和假设检验问题,得出了国内生产总值x关于财政收入y的线性关系显著,并进行了深入研究,提出了小样本常用分布参数的置信区间与假设检验的解决方法。关键词:一元线性回归分析;国内生产总值和财政收入;方差分析II目录一、设计目的.......................................................1二、设计问题........................................................1三、设计原理........................................................1四、设计程序.......................................................2五、结果分析........................................................6六、设计总结........................................................9致谢...............................................................10参考文献...........................................................111财政收入和国家生产总值之间的一元线性回归分析一、设计目的为了更好的了解概率论与数理统计的知识,熟练掌握概率论与数理统计在实际问题上的应用,并将所学的知识结合SPSS数据处理软件对数据的处理解决实际问题。本设计是利用方差分析等对财政收入和柜内生产总值进行分析,并利用SPSS数据处理软件进行求解。二、设计问题现有1992~2006年财政收入和生产总值(单位:亿元)的数据,如表所示,请研究财政收入和国内生产总值之间的线性关系。年份财政收入年份财政收入19923483.37200013395.2319934348.95200116386.0419945218.10200218903.6419956242.20200321715.2519967407.99200426396.4719978651.14200531649.2919989875.95200638760.20199911444.08183867.9210871.071176.678973.084402.389677.199214.6109655.2120332.7135822.8159878.3国内生产总值国内生产总值26923.535333.948197.960793.7由此我们利用这些数据做出国内生产总值x关于财政收入y的线性回归方程。三、设计原理在实际问题中,经常会出现两个变量之间的相关关系不是线性的(即直线型),而是非线性的(即曲线型)。设其中有两个变量X与Y,我们可以用一个确定函数关系式:y=u(𝑥)大致的描述Y与X之间的相关关系,函数u(𝑥)称为Y关于X的回归函数,方程y=u(𝑥)成为Y关于X的回归方程。一元线性回归处理的是两个变量x与y之间的线性关系,可以设想y的值由两部分构成:一部分由自变量x的线性影响所致,表示x的线性函数a+bx;另一部分则由众多其他因素,包括随机因素的影响所致,这一部分可以视为随机误差项,记为ε。可得一元线性回归模型y=a+bx+ε。式中,自变量x是可以控制的随机变量,成为回归变量;固定的未知参数a,b成为回归系数;y称为响应变量或因2变量。由于ε是随机误差,根据中心极限定理,通常假定ε~N(0,𝜎2),𝜎2是未知参数。确定Y与X之间的关系前,可根据专业知识或散点图,选择适当的曲线回归方程,而这些方程往往可以化为线性方程或者就是线性方程,因此,我们可以用线性方程:y=a+bx大致描述变量Y与X之间的关系;回归分析一般分为一元线性回归和多元线性回归,本文采用一元线性回归。回归分析的基本思想是:虽然自变量和因变量之间没有严格的,确定性的函数关系,但可以设法找出最能代表他们之间关系的数学表达式。四、设计程序1、定义3个变量,分别为year(年份),x(国内生产总值),y(财政收入)并输入数据。如图4.1和4.2。图4.1图4.22、做散点图,观察两个变量的相关性。依次选择菜单→图形→旧对话框→散点/点状→简单分布,将国内生产总值作为x轴财政收入作为y轴,得到如图4.3所示的散点图。3图4.3由上图可以看出两变量具有较强的线性关系可以用一元线性回归来拟合两变量。3、一元线性回归分析设置(1)选择菜单“分析→回归→线性”,打开“线性回归”对话框,并按图4.4所示进行设置。图4.4(2)“统计量”对话框设置:单击“统计量(S)…”按钮,打开“线性回4归:统计量”对话框,并按图4.5所示进行设置。图4.5(3)“图形”对话框设置:单击“绘制(T)…”按钮,打开“线性回归:图”对话框,并按图4.6所示进行设置。图4.6(4)“保存”对话框设置:单击“保存(S)…按钮,打开”线性回归:保存“对话框,并按图4.7所示进行设置。5图4.7(5)“选项”对话框设置:单击“选项(O)…”打开线性回归:选项“对话框,并按图4.8所示进行设置。6图4.8五、结果分析1、模型汇总表,主要是回归方程的拟合优度检验,表中显示相关系数R决定系数R方,调整的相关系数的平方和估计值的标准误差等信息,这些信息反映了因变量和自变量之间的线性相关强度。从表中可以看出R=0.989,说明自变量与因变量之间的相关性很强。R方等于0.979说明自变量x可以解释因变量y的97.9%的差异性。模型汇总表b模型RR平方调整后R方标准估计的误差1.989a.979.9771621.66312a.预测变量:(常数),xb.因变量:y72、方差分析表,显示因变量的方差来源、方差平方和、自由度、均方、F检验统计量的观测值和显著性水平。方差来源有回归、残差。从表中可以看出,F统计量的观测值为592.25,显著性概率为0.000,即检验假设“0H:回归系数B=0”成立的概率为0.000,从而应拒绝原假设,说明因变量和自变量的线性关系是非常显著的,可建立线性模型。方差分析表a模型平方和自由度平均值平方F显著性1回归1557492999.81911557492999.819592.250.000b残差34187286.770132629791.290总计1591680286.58914a.财政收入:yb.预测值:(常数),x3、回归系数表,常数项、非标准化的回归系数B值及其标准差、标准化的回归系数值、统计量t值以及显著性水平。从表中可以看出,回归系数的常数项为-4993.281,自变量国内生产总值的回归系数为0.197。因此可以得出回归方程:财政收入y=-4993.281+0.197*国内生产总值x回归系数的显著性水平为0.000,明显小于0.05,故应拒绝T检验的原假设,这也说明了回归系数的显著性,说明建立线性模型是恰当的。回归系数表a模型非标准化系数标准系数T显著性B标准误差Beta1(常量)-4993.281919.356-5.431.000x.197.008.98924.336.0005、残差统计表,依次列出了预测值、标准预测值、预测值的标准误差、调整的预测值、残差、标准残差、student化残差、已剔除的残差、student化已剔除的残差、马氏距离、cook距离以及居中杠杆值。残差统计表a最小值最大值均值标准偏差N预测值315.950936589.832014925.193310547.4878515标准预测值-1.3852.054.0001.00015预测值的标准值418.964983.777570.042165.91015调整的预测值-494.305435325.964814789.414710469.8480915残差-1928.812503167.41895.000001562.6736915标准残差-1.1891.953.000.96415Stud.残差-1.2392.189.0381.06715刪除的残差-2093.780273977.67529135.778671927.9423315Stud.刪除的残差-1.2682.646.0841.16515Mahal距离.0014.219.9331.18115Cool距离.000.825.132.25115居中杠杆值.000.301.067.08415a.因变量:财政收入86、图5-6和图5-7是残差分布直方图和观测累计概率P-P图.再回归分析中总是假设残差服从正态分布,这两个图就是根据样本数据的计算结果显示残差分析实际情况.从残差分布的直方图与附于其上的正态分布曲线的比较,可以观察出残差分析的正态性.同时,从观测量累计概率P-P图也可以看出残差分布服从正态性。图5-6图5-79六、设计总结通过对概率论与数理统计的这道实际问题的解决,不仅使我更加深刻的理解了概率论与数理统计的基础知识,对一元线性回归以及线性回归的方差分析、相关系数的显著性检验有了更深刻的了解,而且使我对这些知识在实际中的应用产生了浓厚的兴趣,同时对我学习好概率论与数理统计这门课有很大帮助。在实现这道题的过程中我应用了SPSS软件,学会了一些软件的应用,更加熟练的操作该软件进行一些数据上的处理。10致谢本论文是在张玉春老师的悉心指导下完成的,老师渊博的知识,严谨的治学态度,一丝不苟的工作作风,平易近人的性格都是我学习的楷模。在此谨向导师表示忠心的感谢和崇高的敬意。同时我还要感谢我的同学们,在论文设计中,他们给了我很多的建议和帮助。我还要感谢我
本文标题:财政收入和国家生产总值之间的一元线性回归分析
链接地址:https://www.777doc.com/doc-2041024 .html