您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 应用回归分析_整理课后习题参考答案
第二章一元线性回归分析思考与练习参考答案2.1一元线性回归有哪些基本假定?答:假设1、解释变量X是确定性变量,Y是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性:E(εi)=0i=1,2,…,nVar(εi)=2i=1,2,…,nCov(εi,εj)=0i≠ji,j=1,2,…,n假设3、随机误差项ε与解释变量X之间不相关:Cov(Xi,εi)=0i=1,2,…,n假设4、ε服从零均值、同方差、零协方差的正态分布εi~N(0,2)i=1,2,…,n2.2考虑过原点的线性回归模型Yi=β1Xi+εii=1,2,…,n误差εi(i=1,2,…,n)仍满足基本假定。求β1的最小二乘估计解:得:2.3证明(2.27式),ei=0,eiXi=0。证明:其中:即:ei=0,eiXi=0niiiniXYYYQ121021))ˆˆ(()ˆ(21112)ˆ()ˆ(iniiniiieXYYYQ0)ˆ(2ˆ111iiniieXXYQ)()(ˆ1211niiniiiXYX01ˆˆˆˆiiiiiYXeYY0100ˆˆQQ2.4回归方程E(Y)=β0+β1X的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价?给出证明。答:由于εi~N(0,2)i=1,2,…,n所以Yi=β0+β1Xi+εi~N(β0+β1Xi,2)最大似然函数:使得Ln(L)最大的0ˆ,1ˆ就是β0,β1的最大似然估计值。同时发现使得Ln(L)最大就是使得下式最小,上式恰好就是最小二乘估计的目标函数相同。值得注意的是:最大似然估计是在εi~N(0,2)的假设下求得,最小二乘估计则不要求分布假设。所以在εi~N(0,2)的条件下,参数β0,β1的最小二乘估计与最大似然估计等价。2.5证明0ˆ是β0的无偏估计。证明:)1[)ˆ()ˆ(1110niixxiniiYLXXXYnEXYEE)])(1([])1([1011iixxiniixxiniXLXXXnEYLXXXnE01010)()1(])1([ixxiniixxiniELXXXnLXXXnE2.6证明证明:)]()1([])1([)ˆ(102110iixxiniixxiniXVarLXXXnYLXXXnVarVarniiiniXYYYQ121021))ˆˆ(()ˆ()1()1()ˆ(2221220xxniiLXnXXXnVar})],([21exp{)2()(),,(2010122/21210iininiiniXYYfL2010122210)],([21)2ln(2)},,({iiniXYnLLn222212]1[])(2)1[(xxxxixxiniLXnLXXXnLXXXn2.7证明平方和分解公式:SST=SSE+SSR证明:2.8验证三种检验的关系,即验证:(1)21)2(rrnt;(2)2221ˆˆ)2/(1/tLnSSESSRFxx证明:(1)22ˆˆ22ˆ((2))(2)ˆ1yyxxyyxxxxxxrLLrLLnrnrtSSELnSSEnSSESSTLr(2)22222011111111ˆˆˆˆˆˆ()()(())(())nnnniiiixxiiiiSSRyyxyyxxyxxL2212ˆ/1ˆ/(2)xxLSSRFtSSEn2.9验证(2.63)式:2211)L)xx(n()e(Varxxii证明:0112222222ˆˆˆvar()var()var()var()2cov(,)ˆˆˆvar()var()2cov(,())()()11[]2[]()1[1]iiiiiiiiiiiiixxxxixxeyyyyyyyxyyxxxxxxnLnLxxnLniiiiniiYYYYYYSST1212]ˆ()ˆ[niiiniiiiniiYYYYYYYY12112)ˆˆ)(ˆ2ˆSSESSR)YˆYYYˆn1i2iin1i2i其中:222221111))(1()(1))(,()()1,())(ˆ,(),())(ˆ,(xxixxiniixxiiiniiiiiiiiLxxnLxxnyLxxyCovxxynyCovxxyCovyyCovxxyyCov2.10用第9题证明是2的无偏估计量证明:2221122112211ˆˆ()()()22()111var()[1]221(2)2nniiiinniiiixxEEyyEennxxennnLnn2.14为了调查某广告对销售收入的影响,某商店记录了5个月的销售收入y(万元)和广告费用x(万元),数据见表2.6,要求用手工计算:表2.6月份12345X12345Y1010202040(1)画散点图(略)(2)X与Y是否大致呈线性关系?答:从散点图看,X与Y大致呈线性关系。(3)用最小二乘法估计求出回归方程。计算表XY2)(XXi2)(YYi))((YYXXiiiYˆ2)ˆ(YYi2)ˆ(iiYY1104100206(-14)2(-4)221011001013(-7)2(3)2320000200042010027727254044004034142(-6)22ˆ22nei和15100和Lxx=10Lyy=600和Lxy=70和100SSR=490SSE=110均3均20均20回归方程为:(4)求回归标准误差先求SSR(Qe)见计算表。所以第三章3.3证明随机误差项ε的方差2的无偏估计。证明:22122222111112221111ˆ(),111()()(1)(1)()(1)1ˆ()()1niinnnnniiiiiiiiiiiiiniiSSEeeenpnpnpEeDehhnhnpEEenp3.4一个回归方程的复相关系数R=0.99,样本决定系数R2=0.9801,我们能判断这个回归方程就很理想吗?答:不能断定这个回归方程理想。因为:1.在样本容量较少,变量个数较大时,决定系数的值容易接近1,而此时可能F检验或者关于回归系数的t检验,所建立的回归方程都没能通过。2.样本决定系数和复相关系数接近于1只能说明Y与自变量X1,X2,…,Xp整体上的线性关系成立,而不能判断回归方程和每个自变量是显著的,还需进行F检验和t检验。3.在应用过程中发现,在样本容量一定的情况下,如果在模型中增.17320ˆˆ,71070ˆ101XYLLxxxyXXY71ˆˆˆ10.055.631102ˆnQe1ˆ2pnSSE加解释变量必定使得自由度减少,使得R2往往增大,因此增加解释变量(尤其是不显著的解释变量)个数引起的R2的增大与拟合好坏无关。3.7验证证明:多元线性回归方程模型的一般形式为:01122ppyxxx其经验回归方程式为01122ˆˆˆˆˆppyxxx,又01122ˆˆˆˆppyxxx,故111222ˆˆˆˆ()()()pppyyxxxxxx,中心化后,则有111222ˆˆˆˆ()()()ipppyyxxxxxx,左右同时除以21()nyyiiLyy,令21(),1,2,,njjijjiLxxin,1,2,,jp11221122121122()ˆ()()ˆˆˆppippiiipyyyyyyppyyLxxLLyyxxxxLLLLLLL样本数据标准化的公式为,,1,2,,ijjiijijjyyxxyyxyinLL,1,2,,jp则上式可以记为112211221122ˆˆˆˆˆˆppiiipipyyyyyyiipipLLLyxxxLLLxxx21ˆˆ*,1,2,...,)jjyynjjjiLjpLLXjjij其中:(X则有ˆˆ,1,2,,jjjjyyLjpL3.11研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系。数据见表3.9(略)。(1)计算出y,x1,x2,x3的相关系数矩阵。SPSS输出如下:相关系数表1.556.731*.724*.095.016.01810101010.5561.113.398.095.756.25410101010.731*.1131.547.016.756.10110101010.724*.398.5471.018.254.10110101010PearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)Nyx1x2x3yx1x2x3Correlationissignificantatthe0.05level(2-tailed).*.则相关系数矩阵为:1.0000.5560.7310.7240.5561.0000.1130.3980.7310.1131.0000.5470.7240.3980.5471.000r(2)求出y与x1,x2,x3的三元回归方程。Coefficientsa-348.280176.459-1.974.0963.7541.933.3851.942.1007.1012.880.5352.465.04912.44710.569.2771.178.284(Constant)x1x2x3Model1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.DependentVariable:ya.对数据利用SPSS做线性回归,得到回归方程为123ˆ348.383.7547.10112.447yxxx(3)对所求的方程作拟合优度检验。ModelSummary.898a.806.70823.44188Model1RRSquareAdjustedRSquareStd.ErroroftheEstimatePredictors:(Constant),x3,x1,x2a.由上表可知,调整后的决定系数为0.708,说明回归方程对样本观测值的拟合程度较好。(4)对回归方程作显著性检验;方差分析表b13655.37034551.7908.283.015a3297.1306549.52216952.5009回归残差总和Model1平方和自由度均方FSig.Predictors:(Constant),x3,x1,x2a.DependentVariable:yb.原假设:0:3210HF统计量服从自由度为(3,6)的F分布,给定显著性水平=0.05,查表得76.4)6.3(05.0F,由方查分析表得,F值=8.2834.76,p值=0.015,拒绝原假设0H,由方差分析表可以得到8.283,0.0150.05FP,说明在置信
本文标题:应用回归分析_整理课后习题参考答案
链接地址:https://www.777doc.com/doc-5200093 .html