您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 人教版高中数学选修23练习第三章31第2课时残差分析Word版含解析
第三章统计案例3.1回归分析的基本思想及其初步应用第2课时残差分析A级基础巩固一、选择题1.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做实验,并用回归分析方法分别求得相关系数r与残差平方和m如下表所示:分类甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果体现A、B两变量有更强的线性相关性()A.甲B.乙C.丙D.丁解析:r越接近1,相关性越强,残差平方和m越小,相关性越强,所以选D正确.答案:D2.为了表示n个点与相应直线在整体上的接近程度,我们常用的表示法为()解析:由回归直线方程可知,为一个量的估计值,而yi为它的实际值,在最小二乘估计中(yi-a-bxi)2,即(yi-)2.答案:C3.甲、乙、丙、丁4位同学各自对A,B两变量进行回归分析,分别得到散点图与残差平方和如下表所示:分类甲乙丙丁散点图残差平方和115106124103哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高()A.甲B.乙C.丙D.丁解析:根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R2的表达式中为确定的数,则残差平方和越小,R2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.答案:D4.通过残差图我们发现在采集样本点过程中,样本点数据不准确的是()A.第四个B.第五个C.第六个D.第八个解析:由题图可知,第六个的数据偏差最大,所以第六个数据不准确.答案:C5.如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强解析:由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.答案:B二、填空题6.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),且ei恒为0,则R2为________.解析:由ei恒为0,知yi=y^i,即yi-y^i=0,答案:17.x,y满足如下表的关系:x0.20.61.01.21.41.61.82.02.2y0.040.3611.41.92.53.23.984.82则x,y之间符合的函数模型为________.解析:通过数据发现y的值与x的平方值比较接近,所以x,y之间的函数模型为y=x2.答案:y=x28.关于x与y,有如下数据:x24568y3040605070有如下的两个模型:(1)y^=6.5x+17.5;(2)y^=7x+17.通过残差分析发现第(1)个线性回归模型比第(2)个拟合效果好.则R21________R22,Q1________Q2(用大于,小于号填空,R,Q分别是相关指数和残差平方和).解析:根据相关指数和残差平方和的意义知R21>R22,Q1<Q2.答案:><三、解答题9.在实验中得到变量y与x的数据如下表所示:x0.06670.03880.03330.02730.0225y39.442.941.043.149.2由经验知,y与1x之间具有线性相关关系,试求y与x之间的回归曲线方程,并预测x0=0.038时,y0的值.解:令u=1x,由题目所给数据可得下表所示的数据:序号uiyiu2iuiyi115.039.4225591225.842.9665.641106.82330.041.09001230436.643.11339.561577.46544.449.21971.362184.48合计151.8215.65101.566689.76计算得b^=0.29,a^=34.32.所以y^=34.32+0.29u.所以试求回归曲线方程为y^=34.32+0.29x.当x0=0.038时,y0=34.32+0.290.38≈41.95.10.关于x与y有以下数据:x24568y3040605070已知x与y线性相关,由最小二乘法得b^=6.5.(1)求y与x的线性回归方程;(2)现有第二个线性模型:y^=7x+17,且R2=0.82.若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由.解:(1)依题意设y与x的线性回归方程为y^=6.5x+a^.—x=2+4+5+6+85=5,—y=30+40+60+50+705=50,因为y^=6.5x+a^经过(—x,—y),所以y与x的线性回归方程为y^=6.5x+17.5.所以50=6.5×5+a^.所以a^=17.5.(2)由(1)的线性模型得yi-yi与yi-—y的关系如下表所示:yi-yi-0.5-3.510-6.50.5yi-—y-20-1010020由于R21=0.845,R2=0.82知R21>R2,所以(1)的线性模型拟合效果比较好.B级能力提升1.在研究身高和体重的关系时,得到的结论是“身高解释了64%的体重变化,而随机误差贡献了剩余的36%,所以身高对体重的效应比随机误差的效应大得多”,则求得的相关指数R2≈()A.0.36B.0.64C.0.32D.0.18解析:根据相关指数的意义知R2≈0.64.答案:B2.若某函数型相对一组数据的残差平方和为89,其相关指数为0.95,则总偏差平方和为________,回归平方和为________.解析:因为R2=1-残差平方和总偏差平方和,0.95=1-89总偏差平方和,所以总偏差平方和为1780;回归平方和=总偏差平方和-残差平方和=1780-89=1691.答案:178016913.某运动员训练次数与成绩之间的数据关系如下:次数x3033353739444650成绩y3034373942464851(1)作出散点图;(2)求出回归方程;(3)作出残差图;(4)计算相关指数R2;(5)试预测该运动员训练47次及55次的成绩.解:(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)—x=39.25,—y=40.875,=13180,a^=—y-b^—x=-0.00388.所以回归方程为y^=1.0415x-0.00388.(3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4)计算得相关指数R2=0.9855,说明了该运动员的成绩的差异有98.55%是由训练次数引起的.(5)由上述分析可知,我们可用回归方程y^=1.0415x-0.00388作为该运动员成绩的预报值.将x=47和x=55分别代入该方程可得y≈49和y≈57.故预测该运动员训练47次和55次的成绩分别为49和57.
本文标题:人教版高中数学选修23练习第三章31第2课时残差分析Word版含解析
链接地址:https://www.777doc.com/doc-5767022 .html