您好,欢迎访问三七文档
回归分析概念•寻求有关联(相关)的变量之间的关系,是指通过提供变量之间的数学表达式来定量描述变量间相关关系的数学过程。•主要内容:1.从一组样本数据出发,确定这些变量间的定量关系式;2.对这些关系式的可信度进行各种统计检验3.从影响某一变量的诸多变量中,判断哪些变量的影响显著,哪些不显著4.利用求得的关系式进行预测和控制分类•按照经验公式的函数类型:线性回归和非线性回归;•按自变量的个数:一元回归和多元回归;•按自变量和因变量的类型:一般的回归分析、含有哑变量的回归分析、Logistic回归分析回归分析的一般步骤•对数据进行预处理,选择合适的变量进行回归分析;•做散点图,观察变量间的趋势,初步选取回归分析方法;•进行回归分析,拟合自变量与因变量之间的经验公式;•拟合完毕之后检验模型是否恰当;•利用拟合结果进行预测控制。简单线性回归简单线性回归分析也称一元线性回归分析,是最简单也是最基本的一种回归分析方法。简单线性回归分析的特点是只涉及一个自变量。它主要用来处理一个因变量与一个自变量之间的线性关系。建立变量之间的线性模型并根据模型做评价和预测。菲利普曲线表明,失业率和通货膨胀率之间存在着替代关系。这是我国1998-2007年的通货膨胀率和城镇登记失业率。试用简单回归分析方法研究这种替代关系在我国是否存在。简单线性回归结果分析:1.模型拟合情况:模型的拟合情况反映了模型对数据的解释能力。修正的可决系数(调整R方)越大,模型的解释能力越强。观察结果1,模型的拟合优度也就是对数据的解释能力一般,修正的决定系数为0.326;结果分析:2.方差分析:方差分析反映了模型整体的显著性,一般将模型的检验P值(Sig)与0.05作比较,如果小于0.05,即为显著。观察结果2,模型是显著的,显著性水平为0.049,小于0.05;结果分析:3.回归方程的系数以及系数的检验结果:回归方程的系数是各个变量在回归方程中的系数值,Sig值表示回归系数的显著性,越小越显著。一般将其与0.05作比较,如果小于0.05,即为显著。观察结果3,模型中的常数项是3.601,t值为24.205,显著性为0.000;通货膨胀的系数是0.157,t值为2.315,显著性为0.049。所以,两个结果都是显著的。模型综述结论:一元线性回归方程:y=a+bx写出最终模型的表达式为:R(失业率)=3.601+0.157*I(通货膨胀率)这意味着通货膨胀率每增加一点,失业率就增加0.157点;通过以上的简单线性回归分析,可知通货膨胀和失业的替代关系在我国并不存在。曲线回归分析我们经常会遇到变量之间的关系为非线性的情况,这时一般的线性回归分析就无法准确的刻画变量之间的因果关系,需要用其他的回归分析方法来拟合模型。曲线回归分析是一种简便的处理非线性问题的分析方法。适用于模型只有一个自变量且可以化为线性形式的情形,基本过程是先将因变量或自变量进行变量转换,然后对新变量进行直线回归分析,最后将新变量还原为原变量,得出变量之间的非线性关系。研究发现,锡克氏试验阴性率随儿童年龄增长而升高。查得山东省某地1~7岁儿童的资料如表,试用曲线回归分析方法拟合曲线。曲线回归分析结果分析:1.模型描述:选择了3个回归方程:线性、对数、立方,分别被定义为方程1、2、3.三个回归方程的因变量都是阴性率,自变量都是儿童年龄,且都包含常数项。结果分析:2.模型情况:下表是对模型情况的概述,可以看出立方曲线模型的R方最高,而且其模型也是很显著的。观察上图结果,发现立方曲线模型的R方最高,也就是模型对数据的解释能力最强,且模型也是最显著的。结果分析:3.拟合曲线图形:下表是三条曲线的拟合情况,图中的圆圈表示实际值,可以发现立方曲线的拟合效果是最好的。观察左图结果,发现立方曲线模型的拟合效果是最好的。模型综述结论:Y=b0+b1t+b2t2+b3t3模型表达式为:Y(阴性率)=24.714+37.999*X(儿童年龄)-6.690X2+0.389X3;模型显著性小于0.05,为显著。拟合度很好,可决系数为0.995。锡克氏试验阴性率跟儿童年龄之间的关系是如模型所示的立方曲线关系。非线性回归分析曲线回归分析只适用于模型只有一个自变量且可以化为线性形式的情形,并且只有11种固定曲线函数可供选择,而实际问题更为复杂,使用曲线回归分析便无法做出准确的分析,这时候就需用到非线性回归分析。它是一种功能更强大的处理非线性问题的方法,可以使用用户自定义任意形式的函数,从而更加准确地描述变量之间的关系。某培训班想建立一个回归模型,对参与培训的企业高管毕业后的长期表现情况进行预测。自变量是高管的培训天数,因变量是高管毕业后的长期表现指数,指数越大,表现越好。如表的数据,试用非线性回归分析方法拟合模型。非线性回归分析多重线性回归分析多重线性回归分析也称多元线性回归分析,是最为常用的一种回归分析方法。多重线性回归分析涉及多个自变量。它用来处理一个因变量与多个自变量之间的线性关系,建立变量之间的线性模型并根据模型做评价和预测。为了检验美国电力行业是否存在规模经济,Nerlove(1963)收集了1955年145家美国电力企业的总成本TC、产量Q、工资率PL、燃料价格PF及资本租赁价格PK的数据。试以总成本为因变量,以产量、工资率、燃料价格及资本租赁价格为自变量,用多重回归分析方法研究其间的关系。多重线性回归分析
本文标题:回归分析
链接地址:https://www.777doc.com/doc-3464469 .html