您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 冶金工业 > 第1讲 暑期数学建模 回归模型
第1讲回归分析2020年1月26日星期日数学建模培训第1讲回归分析第2-3讲时间序列分析第4讲定性计量分析第5讲综合评价法第一讲回归模型第1讲回归分析2020年1月26日星期日第1讲回归分析1.1问题的提出1.2一元回归分析1.3多元回归分析1.4EViews简介数学建模培训第1讲回归分析2020年1月26日星期日若变量(指标)Y和X1、X2、X3…相关联,我们可能需要了解以下问题:1.Xi变动一个单位,会使Y变动多少个单位?比如政府购买支出增加1元钱,GDP会增加多少元?2.Xi变动1%,会使Y变动百分之几?比如物价水平上涨1%,居民收入会下降百分之几?3.能否根据以往Y的数据推测未来Y的情况?下一个月CPI会是多少?1.1问题的提出第1讲回归分析2020年1月26日星期日凯恩斯的绝对收入假定认为居民消费支出Y与国内生产总值X具有如下关系:Y=b0+b1X该宏观经济学模型是确定的函数模型.为更详尽的探讨问题,我们看下面的数据。1.2.1引例---宏观经济学中消费与收入的关系1.2一元回归分析第1讲回归分析2020年1月26日星期日年份居民消费支出Y内生产总值X200045854.698749200149213.2108972.4200252571.3120350.3200356834.4136398.8200463833.5160280.4200571217.5188692.1200680476.9221651.3200793602.9263093.82008108392.2306859.8表1支出法国内生产总值及其构成:单位亿元数据来源:中国统计年鉴(2009)1.2.1引例1.2一元回归分析第1讲回归分析2020年1月26日星期日由上表可知,2005年居民消费支出Y占国内生产总值X的0.377;2006年占0.362;从长期看Y与X的关系如何?为了探讨居民消费支出和国内生产总值的关系,下面我们用字母表示表1中的数据。1.2.1引例---宏观经济学中消费与收入的关系1.2一元回归分析第1讲回归分析2020年1月26日星期日年份居民消费支出Y内生产总值X200045854.698749200149213.2108972.4200252571.3120350.3200356834.4136398.8200463833.5160280.4200571217.5188692.1200680476.9221651.3200793602.9263093.82008108392.2306859.8表1支出法国内生产总值及其构成:单位亿元数据来源:中国统计年鉴(2009)9Y9X91.2.1引例t1234567YtY1Y2Y3Y4Y5Y6Y7XtX1X2X3X4X5X6X78Y8X81.2一元回归分析第1讲回归分析2020年1月26日星期日Y1=b01+b11X1Y2=b02+b12X2Y3=b03+b13X3Y4=b04+b14X4Y5=b05+b15X5Y6=b06+b16X6Y7=b07+b17X7Y8=b08+b18X8Y9=b09+b19X91.2.1引例2000年2001年2002年2003年2004年2005年2006年2007年2008年1.2一元回归分析第1讲回归分析2020年1月26日星期日可以简单记作:Yt=b0t+b1tXt,t=1,2,…,9问题是这样表达人均国内生产总值和人均居民消费的关系符合实际吗?一方面,影响国内生产总值和居民消费的因素很多,且每年都有变化,因此将它们理解成随机变量更合理。另一方面,除了国内生产总值以外影响居民消费因素的还有很多。我们将这些额外的因素总和假设为一随机变量t。则上述模型可进一步表示为:1.2.1引例1.2一元回归分析第1讲回归分析2020年1月26日星期日Yt=b0t+b1tXt+t,t=1,2,…,9假设在这期间经济结构没有发生变化,即b0t和b1t不随着t的变化而变化,则上述模型由可以写成:Yt=b0+b1Xt+t,t=1,2,…,9和确定性经济理论模型不同,它是随机模型。由于b0,b1是待估计的参数,上述模型称为计量经济学模型。同时,从模型的形式可以看出,模型是线性的。模型右端的“b0+b1Xt”称为回归函数,模型通常称为回归模型。1.2.1引例1.2一元回归分析第1讲回归分析2020年1月26日星期日我们将Yt称为被解释变量(或左变量),Xt称为解释变量(或右变量、回归量),b0与b1为待估参数,t称为随机干扰项(或误差项)。1.2.1引例1.2一元回归分析第1讲回归分析2020年1月26日星期日设一元线性回归模型为Yt=b0+b1Xt+t,t=1,2,…,n(1.1)对于给定的样本(Yt,Xt)值,b0和b1的真实值未知,设其估计值为b0^和b1^,则Yt=b0^+b1^Xt+et,t=1,2,…,n其中,et为t的实现值,称为残差。令Yt^=b0^+b1^Xt是对Yt的估计值,也称拟合值。则et=Yt-Yt^1.2.2参数估计的方法----普通最小二乘估计1.2一元回归分析第1讲回归分析2020年1月26日星期日自然希望et其绝对值越小越好,但通常要使得参数能够满足et都达到最小是难以做到的。1.2.2参数估计的方法----普通最小二乘估计ntttXYQ1210)ˆˆ(bb普通最小二乘法是使得它们的平方和达到最小,即达到最小。所以Q取最小值时的参数值,是一种理想的参数估计值。Q取极值的一阶条件为:0)(012100bbbbntttXYQ0)(112101bbbbntttXYQ1.2一元回归分析第1讲回归分析2020年1月26日星期日解得:1.2.2参数估计的方法----普通最小二乘估计0)(110ntttXYbb0)(110nttttXXYbb(1.2)(*)称为正规方程组。当n∑Xt2-(∑Xt)2≠0时,可以解得参数的估计量为:2220)(ˆtttttttXXnXYXYXb221)(ˆttttttXXnXYXYnb(1.3)1.2一元回归分析第1讲回归分析2020年1月26日星期日1.2.2参数估计的方法----普通最小二乘估计年份居民消费支出Y内生产总值X200045854.698749200149213.2108972.4200252571.3120350.3200356834.4136398.8200463833.5160280.4200571217.5188692.1200680476.9221651.3200793602.9263093.82008108392.2306859.8表1支出法国内生产总值及其构成:单位亿元数据来源:中国统计年鉴(2009)1.2一元回归分析第1讲回归分析2020年1月26日星期日将参数估计值带入回归模型,并忽略残差,得Yt^=b0^+b1^Xt(1.4)Yt^是利用参数估计值与解释变量的样本值估计到的被解释变量Yt的估计值。1.2.3模型的检验方法1.2一元回归分析第1讲回归分析2020年1月26日星期日我们得到的参数估计值可靠吗?自然要问用Yt^来估计Yt的精度如何?这需要我们对模型进行一系列的检验。为什么要进行各种检验呢?首先,模型应该具有经济意义,即估计得到的参数值应与经济理论要求的参数的大小、符号、条件相一致。这需要检验;其次,参数的估计值和真实值是有区别的,这就需要进行假设检验,检验真实值的大小。1.2.3模型的检验方法1.2一元回归分析第1讲回归分析2020年1月26日星期日为了进行假设检验我们对一元回归模型进行如下假设:假定(误差项无偏性假定)1E(t)=0,t=1,2,…,n(1.5)假定(无序列相关性假定)2Cov(t,s)=0,t≠s,t,s=1,2,…,n(1.6)假定(同方差假定)3Var(t)=s20,t=1,2,…,n(1.7)1.2.3模型的检验方法1.2一元回归分析第1讲回归分析2020年1月26日星期日假定(解释变量与误差项不相关假定)4Cov(Xt,s)=0,t≠s,i,j=1,2,…,n(1.8)假定(正态误差假定)5t~N(0,s2),t=1,2,…,n(1.9)假定(无多重共线性假定)6任何解释变量之间不存在严格的线性相关。对基本假设的进一步说明1.假定1的含义是解释变量几乎完全能够解释被解释变量,不可预知的因素对被解释变量的影响的总体平均水平为0。1.2.3模型的检验方法1.2一元回归分析第1讲回归分析2020年1月26日星期日2.假定1~3能够保证普通最小二乘估计量是无偏的、有效性的估计量。3.假设6能够保证最小二乘估计量解的存在性。4.假设5用于对参数估计量的检验5.假设2和假设5,进一步说明误差项前后期是相互独立的(服从正态分布的两个随机变量,独立和不相关是等价的)1.2.3模型的检验方法1.2一元回归分析第1讲回归分析2020年1月26日星期日(1)单个参数的t检验统计量命题1在模型满足假定1~6的条件下,原假设H0:bi=bi*成立时,1.2.3模型的检验方法),2(~ˆ0ˆ*00ntStbbb其中,n为样本容量。,)()2(2222ˆ0XXnnXeStttb)2(~ˆ1ˆ*11ntStbbb222ˆ)()2(1XXneSttb1.2一元回归分析第1讲回归分析2020年1月26日星期日t)2(2nt)2(2nt220●●要拒绝原假设H0:bi=bi*成立时,则b^i-bi*应足够大,换句话说Prob(-|t|t(n-2)|t|)=1-p应足够大。因此得到p值检验法:第一步:根据bi的假设值计算t统计量的值;1.2.3模型的检验方法1.2一元回归分析第1讲回归分析2020年1月26日星期日第二步:计算p=2Prob(t(n-2)|t|);第三步:比较判别,如果p就接受H0,即认为bi=bi*,否则拒绝H0,接受H1,即认为bi≠bi*。通常b0*=0,b1*=0,=0.05。即检验参数真实值是否为0。若p,我们说对应的解释变量对被解释变量没有显著性影响。若p,我们说对应的解释变量对被解释变量有显著性影响。1.2.3模型的检验方法1.2一元回归分析第1讲回归分析2020年1月26日星期日(2)决定系数R2为了反映回归拟合的程度,我们将总偏差进行分解)ˆ()ˆ(ttttYYYYYY其中Y-=∑Yt/n.即被解释变量的总偏差Yt-Y-可分解为可解释偏差Yt^-Y-和残差Yt-Yt^.tteYY)ˆ(总离差平方和为了反映模型总的拟合程度,我们定义回归平方和2)(YYTSSt剩余平方和22)ˆ(titeYYRSS2)ˆ(YYESSt1.2一元回归分析1.2.3模型的检验方法第1讲回归分析2020年1月26日星期日XXtXOYYtYˆYYtˆteYYttY●●●1.2一元回归分析1.2.3模型的检验方法第1讲回归分析2020年1月26日星期日1.2.3模型的检验方法可以证明:TSS=RSS+ESS。显然ESS在TSS中占的比重越大残差平方和越小,模型的拟合优度越高.定义可决系数R2:TSSESSR2TSSRSS1显然,0≤R2≤1,R2越接近于1,模型的拟合优度越高.1.2一元回归分析第1讲回归分析2020年1月26日星期日k为解释变量的数目,n称为样本容量.称模型右边部分b1X1i+b2X2i+…+bkXki为回归函数或回归.系数bj亦称为回归系数.多元线性回归模型的检验方法与一元回归模型的检验方法类似,这里不再赘述。其中,Yi称为被解释变量;Xji称为解释变量,是非随机变量,i是无法观测的回归量无法解释的满足一定限制条件的随机误差项,bj为未知待估参数.多元线性回归模型的一般形式为:(1.10),1ikjjijiXYbni,,2,11.3多元回归分析第1讲回归分析2020年1月26日星
本文标题:第1讲 暑期数学建模 回归模型
链接地址:https://www.777doc.com/doc-3307080 .html