您好,欢迎访问三七文档
第11章一元线性回归11.1变量间关系的度量11.2一元线性回归11.3利用回归方程进行估计和预测11.4残差分析11.1变量间关系的度量一、变量间的关系二、相关关系的描述与测度三、相关系数的显著性检验一、变量间的关系1.确定性关系-函数关系例如某种商品的销售额(y)与销售量(x)之间的关系可表示为(p为单价)2.非确定性关系-相关关系例如子女身高(y)与父母身高(x)之间的关系.pxy相关关系的类型相关关系线性相关非线性相关正相关负相关二、相关关系的描述与测度(一)散点图(scatterdiagram)完全正线性相关完全负线性相关非线性相关正线性相关负线性相关不相关图11-1不同形态的散点图例11.6一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款.近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力.为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法.下面是该银行所属的25家分行2002年的有关业务数据.表11-1某商业银行2002年的有关业务数据分行编号不良货款(亿元)各项货款余额(亿元)本年累计应收货款(亿元)货款项目个数(个数)本年固定资产投资额(亿元)10.967.36.85.051.921.1111.319.816.090.934.8173.07.717.073.743.280.87.210.014.557.8199.716.519.063.262.716.22.21.02.271.6107.410.717.020.2812.5185.427.118.043.891.096.11.710.055.9102.672.89.114.064.3110.364.22.111.042.7124.0132.211.223.076.7130.858.66.014.022.8143.5174.612.726.0117.11510.2263.515.634.0146.7163.079.38.915.029.9170.214.80.62.042.1180.473.55.911.025.3191.024.75.04.013.4206.8139.47.228.064.32111.6368.216.832.0163.9221.695.73.810.044.5231.2109.610.314.067.9247.2196.215.816.039.7253.2102.212.010.097.1图11-2024681012140100200300400贷款余额不良贷款不良贷款与贷款余额的散点图图11-302468101214051015202530累计应收贷款不良贷款不良贷款与累计应收贷款的散点图图11-402468101214050100150200贷款项目个数不良贷款不良贷款与贷款项目个数的散点图图11-5不良贷款与固定资产投资额的散点图0246810121402040固定资产投资额不良贷款(二)相关系数(correlationcoefficient)1.变量之间线性相关关系的程度和方向的特征数.2.两个变量之间线性相关程度的度量,也称简单相关系数.3.根据总体全部数据计算而得的相关系数,称总体相关系数,记为.4.根据样本数据计算而的得相关系数,称为样本相关系数,记为.r样本相关系数计算niiniiniiiyyxxyyxxr12121)()())(((11.1)或(10.2)x和y的样本相关系数为niniiiniiniininiiniiiiyynxxnyxyxnr11221212111)()(相关系数的取值范围及意义1.r的取值范围为[-1,1].2.,称完全相关,既存在线性函数关系.r=1,称完全正相关.r=-1,称完全负相关.3.r=0,称零相关,既不存在线性相关关系.4.r<0,称负相关.5.r>0,称正相关.6.愈大,表示相关关系愈密切.1rr例11.7根据例11.6的样本数据,计算不良贷款、贷款余额、应收贷款、贷款项目、固定资产投资额之间的相关系数.解:用Excel计算的相关系数矩阵如下.三、相关系数的显著性检验(一)r的抽样分布当样本数据来自正态总体,且时,则00:,0:10HH0H)2(2nttP)2(2ntt则拒绝,接受.否则接受.0H1H0H(二)相关系数的显著性检验(1)(2)在成立条件下,则(3)对规定的显著性水平,若)2(~122ntrnrt(11.3)例11.8)05.0(例11.7的相关系数检验.1.2.计算检验的统计量3.根据,查表得0:,0:10HH232,05.0n069.2)23(5344.7205.0tt因此,拒绝,认为x和y的相关系数,即不良贷款与贷款余额之间的线性相关关系显著.0H069.2)23(205.0t05344.78436.012258436.02t由于表11-3各相关系数显著性检验的t统计量值11.2一元线性回归一、一元线性回归模型二、参数的最小二乘估计三、回归直线的拟合优度四、显著性检验回归分析与相关分析的区别1.相关分析中x和y都处于相同地位,而回归分析中,y称因变量,x称自变量.2.相关分析中x和y都是随机变量,而在回归分析中,因变量y是随机变量,自变量x则可以是随机变量,也可以是非随机变量.3.相关分析主要是描述变量之间的相关关系,而回归分析主要是确定变量之间的内在联系.回归模型的类型示意图回归模型一元回归多元回归线性回归非线性回归线性回归非线性回归一、一元线性回归模型(一)回归模型(regressionmodel)xy10称为一元线性回归模型.1.一元线性回归模型只含有一个自变量x.2.误差项为随机变量.3.一元线性回归模型描述因变量y与自变量x和误差项的关系.4.和称为模型的参数.10(11.4)一元线性回归模型的基本假定1.误差项是一个期望值为0的随机变量,即2.对于所有的x值,误差项的方差都相同,即0)(ExyE10)(2)(D于是3.误差项相互独立且服从正态分布,即),0(~2N(二)回归方程(regressionequation)xyE10)(1称为总体线性回归方程.是回归直线在y轴上的截距,是当x=0时的值.是直线的斜率,表示当x每变动一个单位时,相应的变动值.0)(yE)(yE(11.5)(三)估计的回归方程(estimatedregressionequation)1.和是未知参数,可以根据样本数据作估计.2.和的估计记为和,则101010ˆˆxy10ˆˆˆyˆ称为样本回归方程或估计的回归方程.3.是样本回归方程的斜率,表示x每变动一个单位时的相应变化量。而则是样本回归方程的截距.即x=0时,.1ˆ0ˆ0ˆˆy(11.6)二、参数的最小二乘估计假定样本数据,满足一元线性回归模型,根据(11.6)式则样本回归方程为iyiyˆ1010ˆˆniiiniiiniiexyyyQ12210121)ˆˆ()ˆ(达到最小,称和为和的最小二乘估计.10ˆˆ10(11.8)niyxii,,2,1,),(最小二乘法是使因变量的观察值与估计值之间的离差平方和达到最小来求和的估计和的方法,即使nixyii,,2,1,ˆˆˆ10(11.7)续根据微积分中求极值的原理,和应满足下列方程组10ˆˆ0)ˆˆ(2ˆ0)ˆˆ(2ˆ10111010iiniiiniixxyQxyQ得正规方程组niiiniiniiniiniiyxxxyxn1121101110ˆˆˆˆ(11.10)(11.9)续解正规方程组得niiniiixxyyxxxy121110)())((ˆˆˆ(11.11)例11.9根据例11.6的数据,建立不良贷款y对贷款余额x的回归方程.根据(11.11)式得8295.0268.120037895.0728.3ˆ037895.05744.1549331624.5871ˆ01从而样本回归方程为xy037895.08295.0ˆ因此贷款余额增长1亿元时,则不良贷款增长约0.037895亿元.图11-6不良贷款对贷款余额的回归直线024681012140100200300400贷款余额不良贷款用Excel进行回归分析第1步:选择【工具】下拉菜单第2步:选择【数据分析】选项第3步:在分析工具中选择【回归】,然后选择【确定】第4步:当对话框出现时在【Y值输入区域】方框内键入Y的数据区域在【X值输入区域】方框内键入X的数据区域在【置信度】选项中给出所需的数值在【输出选项】中选择输出区域在【残差】分析选项中选择所需的选项表11-4用Excel进行回归分析的步骤表11-5Excel输出的回归分析结果三、回归直线的拟合优度(一)判定系数1.平方和分解用SST表示因变量的总离差平方和,反映y全部数据的离散程度,即21)(niiyySST并可分解成如下形式)ˆ)(ˆ(2)ˆ()ˆ()ˆ()ˆ()(121212121yyyyyyyyyyyyyySSTiniiiniiniiiniiiinii(11.14)(11.12)续由于于是212121)ˆ()ˆ()(niiniiiniiyyyyyySST(11.15)0)ˆ)(ˆ(1yyyyiniii其中SSE称为残差平方和,是由随机因素和其他未加控制的因素引起的,反映除x以外的其他因素对y的影响大小.而SSE称为回归平方和,是由x和y的线性关系引起的y的取值变化,反映x对y的影响大小.从而三个平方和的关系为SSESSRSST(11.16)2.判定系数212121212)()ˆ(1)()ˆ(niiniiiniiniiyyyyyyyySSTSSRR(1)表示回归平方和占总离差平方和的比例(11.17)(2)反映样本回归方程的拟合优度.(3)取值范围为[0,1].(4)R2愈大,说明回归方程拟合得愈好.(5)判定系数为样本相关系数r的平方.判定系数与样本相关系数的关系212122112122112122)()())(()()(ˆ)()ˆ(ryyxxyyxxyyxxyyyyRniiniiniiiniiniiniinii(11.19)相关系数与回归系数之间的数量关系niiniiniiniiniiiyyxxyyxxyyxxr1212112121)()(ˆ)()())((这就是说与的正负号必定相同.1ˆr例11.10即回归平方和占总离差平方和的71.16%,或者说,在不良贷款的变动中,有71.16%是由贷款余额所决定的.7116.06504.3124860.2222SSTSSRR根据例11.6的数据,计算不良贷款对贷款余额的判定系数.解:根据(11.17)式,得(二)估计标准误差(standarderrorofestimate)误差项的标准差的估计称为估计标准误差,或称为估计量的标准差.例11.11根据例11.6的数据,计算估计标准误差.解:根据(11.20)式,得四、显著性检验(一)线性关系的检验三个平方和的自由度(1)SST的自由度为n-1(2)SSR的自由度为1(3)SSE的自由度为n-2关于自由度存在如下的
本文标题:19一元线性回归
链接地址:https://www.777doc.com/doc-3642116 .html