您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 应用回归分析-第2章课后习题参考答案汇总
第二章一元线性回归分析思考与练习参考答案2.1一元线性回归有哪些基本假定?答:假设1、解释变量X是确定性变量,Y是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性:E(εi)=0i=1,2,…,nVar(εi)=2i=1,2,…,nCov(εi,εj)=0i≠ji,j=1,2,…,n假设3、随机误差项ε与解释变量X之间不相关:Cov(Xi,εi)=0i=1,2,…,n假设4、ε服从零均值、同方差、零协方差的正态分布εi~N(0,2)i=1,2,…,n2.2考虑过原点的线性回归模型Yi=β1Xi+εii=1,2,…,n误差εi(i=1,2,…,n)仍满足基本假定。求β1的最小二乘估计解:得:2.3证明(2.27式),ei=0,eiXi=0。证明:其中:即:ei=0,eiXi=0niiiniXYYYQ121021))ˆˆ(()ˆ(21112)ˆ()ˆ(iniiniiieXYYYQ0)ˆ(2ˆ111iiniieXXYQ)()(ˆ1211niiniiiXYX01ˆˆˆˆiiiiiYXeYY0100ˆˆQQ2.4回归方程E(Y)=β0+β1X的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价?给出证明。答:由于εi~N(0,2)i=1,2,…,n所以Yi=β0+β1Xi+εi~N(β0+β1Xi,2)最大似然函数:使得Ln(L)最大的0ˆ,1ˆ就是β0,β1的最大似然估计值。同时发现使得Ln(L)最大就是使得下式最小,上式恰好就是最小二乘估计的目标函数相同。值得注意的是:最大似然估计是在εi~N(0,2)的假设下求得,最小二乘估计则不要求分布假设。所以在εi~N(0,2)的条件下,参数β0,β1的最小二乘估计与最大似然估计等价。2.5证明0ˆ是β0的无偏估计。证明:)1[)ˆ()ˆ(1110niixxiniiYLXXXYnEXYEE)])(1([])1([1011iixxiniixxiniXLXXXnEYLXXXnE01010)()1(])1([ixxiniixxiniELXXXnLXXXnE2.6证明证明:)]()1([])1([)ˆ(102110iixxiniixxiniXVarLXXXnYLXXXnVarVarniiiniXYYYQ121021))ˆˆ(()ˆ()1()1()ˆ(2221220xxniiLXnXXXnVar})],([21exp{)2()(),,(2010122/21210iininiiniXYYfL2010122210)],([21)2ln(2)},,({iiniXYnLLn222212]1[])(2)1[(xxxxixxiniLXnLXXXnLXXXn2.7证明平方和分解公式:SST=SSE+SSR证明:2.8验证三种检验的关系,即验证:(1)21)2(rrnt;(2)2221ˆˆ)2/(1/tLnSSESSRFxx证明:(1)22ˆˆ22ˆ((2))(2)ˆ1yyxxyyxxxxxxrLLrLLnrnrtSSELnSSEnSSESSTLr(2)22222011111111ˆˆˆˆˆˆ()()(())(())nnnniiiixxiiiiSSRyyxyyxxyxxL2212ˆ/1ˆ/(2)xxLSSRFtSSEn2.9验证(2.63)式:2211)L)xx(n()e(Varxxii证明:0112222222ˆˆˆvar()var()var()var()2cov(,)ˆˆˆvar()var()2cov(,())()()11[]2[]()1[1]iiiiiiiiiiiiixxxxixxeyyyyyyyxyyxxxxxxnLnLxxnLniiiiniiYYYYYYSST1212]ˆ()ˆ[niiiniiiiniiYYYYYYYY12112)ˆˆ)(ˆ2ˆSSESSR)YˆYYYˆn1i2iin1i2i其中:222221111))(1()(1))(,()()1,())(ˆ,(),())(ˆ,(xxixxiniixxiiiniiiiiiiiLxxnLxxnyLxxyCovxxynyCovxxyCovyyCovxxyyCov2.10用第9题证明是2的无偏估计量证明:2221122112211ˆˆ()()()22()111var()[1]221(2)2nniiiinniiiixxEEyyEennxxennnLnn2.11验证决定系数与F值之间的关系式22nFFr证明:211/121/(/(2))1221SSRSSRrSSTSSRSSESSESSRnSSRSSEnFnFnF2.14为了调查某广告对销售收入的影响,某商店记录了5个月的销售收入y(万元)和广告费用x(万元),数据见表2.6,要求用手工计算:表2.6月份12345X12345Y1010202040(1)画散点图(略)(2)X与Y是否大致呈线性关系?答:从散点图看,X与Y大致呈线性关系。2ˆ22nei(3)用最小二乘法估计求出回归方程。计算表XY2)(XXi2)(YYi))((YYXXiiiYˆ2)ˆ(YYi2)ˆ(iiYY1104100206(-14)2(-4)221011001013(-7)2(3)2320000200042010027727254044004034142(-6)2和15100和Lxx=10Lyy=600和Lxy=70和100SSR=490SSE=110均3均20均20回归方程为:(4)求回归标准误差先求SSR(Qe)见计算表。所以(5)给出的置信度为95%的区间估计;由于(1-)的置信度下,的置信区间是查表可得915.110667.36ˆ2ˆ1xxLS所以的95%的区间估计为:(7—3.182*1.915,7+3.182*1.915),即(0.906,13.094)。351.6)102551(667.36)1(ˆ22ˆ0xxLXnS所以的95%的区间估计为:(-1-3.182*6.351,-1+3.182*6.351),即(-21.211,19.211)。^0的置信区间包含0,表示^0不显著。(6)计算x和y的决定系数.17320ˆˆ,71070ˆ101XYLLxxxyXXY71ˆˆˆ10.055.631102ˆnQe10ˆ,ˆ22ˆˆˆˆ(,)iiiitstsiˆ182.3)3()2(025.02/tnt1ˆ0ˆ817.06004902yyLSSRSSTSSRR说明回归方程的拟合优度高。(7)对回归方程作方差分析方差分析表方差来源平方和自由度均方F值SSR490149013.364SSE110336.667SST6004F值=13.364F0.05(1,3)=10.13(当n1=1,n2=8时,α=0.05查表得对应的值为10.13),所以拒绝原假设,说明回归方程显著。(8)做回归系数β1的显著性检验H0:β1=0656.3915.1/7/ˆ1ˆ1Stt值=3.656t0.05/2(3)=3.182,所以拒绝原假设,说明x对Y有显著的影响。(8)做相关系数R的显著性检验R值=0.904R0.05(3)=0.878,所以接受原假设,说明x和Y有显著的线性关系。(9)对回归方程作残差图并作相应的分析残差图(略).从残差图上看出,残差是围绕e=0在一个固定的带子里随机波动,基本满足模型的假设ei~N(0,2),但由于样本量太少,所以误差较大.(10)求广告费用为4.2万元时,销售收入将达到多少?并给出置信度为95%的置信区间.解:当X0=4.2时,904.0817.02SSTSSRRR4.282.471ˆˆˆ0100XY所以广告费用为4.2万元时,销售收入将达到28.4万元.由于置信度为1-α时,Y0估计值的置信区间为:)1044.1511(667.36)(11(ˆ202ˆ00xxYYLXXnS所以求得Y0的95%的置信区间为:[6.05932,50.74068]预测误差较大.2.15一家保险公司十分关心其总公司营业部加班的制度,决定认真调查一下现状。经过十周时间,收集了每周加班工作时间的数据和签发的新保单数目,x为每周新签发的保单数目,y为每周加班工作时间(小时)。见表2.7。表2..7周序号12345678910X825215107055048092013503256701215Y3.51.04.02.01.03.04.51.53.05.01、画散点图140012001000800600400200每周签发的新保单数目5.04.03.02.01.0每周加班工作时间(小时)散点图2、由散点图可以看出,x与y之间大致呈线性关系。00202ˆ000ˆ0ˆˆYYYYStYYStY3、用最小二乘法求出回归系数由表可知:118.0βˆ0=00359.0βˆ1=回归方程为:x00359.0118.0yˆ+=4、求回归标准误差σˆ方差分析表b16.682116.68272.396.000a1.8438.23018.5259回归残差总和模型1平方和自由度均方FP值Predictors:(Constant),每周签发的新保单数目a.DependentVariable:每周加班工作时间(小时)b.由方差分析表可以得到:SSE=1.843故回归标准误差2^2SSEn,^=0.48。5、给出回归系数的置信度为95%的区间估计由回归系数显著性检验表可以看出,当置信度为95%时:^0的预测区间为[-0.701,0.937],^1的预测区间为[0.003,0.005].回归系数显著性检验表a.118.355.333.748-.701.937.004.000.9498.509.000.003.005(Constant)每周签发的新保单数目模型1B标准误未标准化系数β标准化系数tP值下限上限95%回归系数的置信区间DependentVariable:每周加班工作时间(小时)a.回归系数显著性检验表a.118.355.333.748-.701.937.004.000.9498.509.000.003.005(Constant)每周签发的新保单数目模型1B标准误未标准化系数β标准化系数tP值下限上限95%回归系数的置信区间DependentVariable:每周加班工作时间(小时)a.^0的置信区间包含0,表示^0不拒绝为零的假设。6、决定系数由模型概要表得到决定系数为0.9接近于1,说明模型的拟合优度高。7.对回归方程作方差分析由方差分析表可知:F值=72.3965.32(当n1=1,n2=8时,查表得对应的值为5.32)P值≈0,所以拒绝原假设,说明回归方程显著。8、对^1的显著性检验从上面回归系数显著性检验表可以得到^1的t统计量为t=8.509,所对应的p值近似为0,通过t检验。说明每周签发的新保单数目x对每周加班工作时间y有显著的影响。9.做相关系数显著性检验模型概要b.949a.900.888.4800.753模
本文标题:应用回归分析-第2章课后习题参考答案汇总
链接地址:https://www.777doc.com/doc-1834496 .html