您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 高中数学人教版选修12课时提升作业一11回归分析的基本思想及其初步应用探究导学课型W
温馨提示:此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。关闭Word文档返回原板块。课时提升作业(一)回归分析的基本思想及其初步应用(25分钟60分)一、选择题(每小题5分,共25分)1.下列三个说法:(1)残差平方和越小的模型,拟合的效果越好;(2)用R2来刻画回归的效果时,R2的值越小,说明模型拟合的效果越好;(3)直线y=bx+a和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差[yi-(bxi+a)]2是该坐标平面上所有直线中与这些点的偏差最小的直线.其中正确的个数为()A.1个B.2个C.3个D.4个【解析】选B.由R2的定义可知:R2越接近于1,表明两个随机变量线性相关性越强,所以(2)不正确,其余说法正确.2.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温x(℃)181310-1用电量y(度)24343864由表中数据得回归直线方程y=bx+a中b≈-2,预测当气温为-4℃时,用电量的度数约为()A.68℃B.67℃C.66℃D.65℃【解析】选A.由表格得(,)为(10,40),又(,)在回归方程y=bx+a上且b≈-2,所以40=10×(-2)+a,解得:a=60,所以y=-2x+60.当x=-4时,y=-2×(-4)+60=68.3.(2014·重庆高考)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据测算的线性回归方程可能是()A.y=0.4x+2.3B.y=2x-2.4C.y=-2x+9.5D.y=-0.3x+4.4【解题指南】根据正相关可知斜率为正,再根据线性回归方程经过点(,)可求出结果.【解析】选A.由正相关可知斜率为正,故可排除C,D两项,又因为y=0.4x+2.3经过点(3,3.5),故A项正确.【补偿训练】(2015·临沂高二检测)某饮料店的日销售收入y(单位:百元)与当天平均气温x(单位:度)之间有下列数据关系:x-2-1012y54221甲、乙、丙三位同学对上述数据进行了研究,分别得到了x与y之间的三个线性回归方程:①y=-x+2.8,②y=-x+3,③y=-1.2x+2.6;其中正确的是()A.①B.②C.③D.①③【解析】选A.回归方程y=bx+a表示的直线必过点(,),即必过点(0,2.8),而给出的三个线性回归方程中,只有①表示的直线过点(0,2.8),故正确的是①.4.(2015·泰安高二检测)在回归分析中,R2的值越大,说明残差平方和()A.越大B.越小C.可能大也可能小D.以上均错【解析】选B.因为R2=n2iii1n2ii1(yy)1(yy),所以当R2越大时,(yi-iy)2越小,即残差平方和越小.5.(2015·福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程y=bx+a,其中b=0.76,a=-b.据此估计,该社区一户年收入为15万元家庭的年支出为()A.11.4万元B.11.8万元C.12.0万元D.12.2万元【解题指南】样本中心点(,)一定在回归直线上.【解析】选B.由题意得==10,==8,所以a=8-0.76×10=0.4,所以y=0.76x+0.4,把x=15代入得到y=11.8.二、填空题(每小题5分,共15分)6.在研究身高和体重的关系时,求得相关指数R2≈,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多.【解析】结合R2的计算公式R2=n2iii1n2ii1(yy)1(yy)可知,当R2=0.64时,身高解释了64%的体重变化.答案:0.647.若根据10名儿童的年龄x(岁)和体重y(kg)数据用最小二乘法得到用年龄预报体重的回归方程是y=2x+7,已知这10名儿童的年龄分别是2,3,3,5,2,6,7,3,4,5,则这10名儿童的平均体重是.【解析】由题意可得=2+7,又=4,所以=15.答案:15kg8.(2015·扬州高二检测)某校高二(8)班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)构成如下数据(15,79),(23,97),(16,64),(24,92),(12,58),求得的回归直线方程为y=2.5x+a,则某同学每周学习20小时,估计数学成绩约为分.【解析】=×(15+23+16+24+12)=18,=×(79+97+64+92+58)=78,把(,)代入y=2.5x+a,可求得a=33,把x=20代入y=2.5x+33得y=2.5×20+33=83.答案:83三、解答题(每小题10分,共20分)9.关于x与y有如下数据关系:x24568y3040605070为了对x,y两个变量进行统计分析,现有以下两种线性模型:甲模型y=6.5x+17.5,乙模型y=7x+17,试比较哪一个模型拟合的效果更好.【解析】=52iii152ii1(yy)1(yy)=1-=0.845,=52iii152ii1(yy)1(yy)=1-=0.82,84.5%82%,所以甲模型拟合效果更好.【拓展延伸】R2=1-n2ii1n2ii1(yy)1(yy)的意义R2越大,残差平方和越小,从而回归模型的拟合效果越好.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R2越接近1,表示回归的效果越好(因为R2越接近1,表示解释变量和预报变量的线性相关性越强).10.(2015·深圳高二检测)PM2.5是指大气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物).为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某一时间段车流量与PM2.5的数据如表:时间周一周二周三周四周五车流量x(万辆)5051545758PM2.5的浓度y(微克/立方米)6970747879(1)根据上表数据,请在下列坐标系中画出散点图.(2)根据上表数据,用最小二乘法求出y关于x的线性回归方程y=bx+a.(3)若周六同一时间段车流量是25万辆,试根据(2)求出的线性回归方程预测,此时PM2.5的浓度为多少(保留整数).【解析】(1)散点图如图所示.(2)因为==54,==74,(xi-)(yi-)=4×5+3×4+3×4+4×5=64,(xi-)2=(-4)2+(-3)2+32+42=50,b=5iii152ii1(xx)yy(xx)()==1.28,a=-b=74-1.28×54=4.88,故y关于x的线性回归方程是y=1.28x+4.88.(3)当x=25时,y=1.28×25+4.88=36.88≈37,所以可以预测此时PM2.5的浓度约为37微克/立方米.(20分钟40分)一、选择题(每小题5分,共10分)1.(2015·眉山高二检测)已知样本点散落在某一条曲线y=abxe附近,作变换z=lny,利用线性回归模型来求其中的参数a,b,则拟合其变换后的样本点的直线方程为()A.zbxaB.zbxeaC.zbxlnaD.zbxlna【解析】选A.对方程y=abxe两边取以e为底的对数即得.2.已知一系列样本点(xi,yi)(i=1,2,3,…,n)的回归直线方程为y=2x+a,若样本点(r,1)与(1,s)的残差相同,则有()A.r=sB.s=2rC.s=3-2rD.s=2r+1【解析】选C.由残差的定义可得,1-(2r+a)=s-(2+a),化简得s=3-2r.【延伸探究】若将题中的“y=2x+a”改为“y=bx+a”,同时将“样本点(r,1)与(1,s)”改为“样本点(1,1)与(2,4)”,则b=.【解析】由残差的定义可得1-(b+a)=4-(2b+a),化简得b=3.答案:3二、填空题(每小题5分,共10分)3.已知回归方程为y=2x+1,而实验得到的一组数据为(2,4.9),(3,7.1),(4,9.1),则残差平方和为.【解析】(yi-yi)2=(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.答案:0.034.(2015·石家庄高二检测)已知一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其样本点的中心为(2,3),若其回归直线的斜率估计值为-1.2,则该回归直线方程为.【解析】由题意可设回归直线为y=-1.2x+a,由于回归直线过样本点的中心(2,3),故有3=-1.2×2+a,解得a=5.4,故回归直线方程为y=-1.2x+5.4.答案:y=-1.2x+5.4【补偿训练】(2014·渭南高二检测)已知x与y之间的几组数据如下表:x0134y1469则y与x的线性回归方程y=bx+a过点()A.(0,1)B.(1,4)C.(2,5)D.(5,9)【解析】选C.因为==2,==5,所以根据线性回归方程必过样本中心点,可得y=bx+a必过(2,5).三、解答题(每小题10分,共20分)5.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程y=bx+a,其中b=-20,a=-b.(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解题指南】(1)利用线性回归系数公式求出a,b的值,从而可确定回归直线方程.(2)利用二次函数求最值.【解析】(1)由于=×(8+8.2+8.4+8.6+8.8+9)=8.5,=×(90+84+83+80+75+68)=80,又b=-20,所以a=-b=80+20×8.5=250,从而回归直线方程为y=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20(x-8.25)2+361.25.当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.【拓展延伸】建立回归模型的基本步骤(1)确定解释变量和预报变量.(2)画散点图,观察是否存在线性相关关系.(3)确定回归方程的类型,如y=bx+a.(4)按最小二乘法估计回归方程中的参数.(5)得结果后分析残差图是否异常,若存在异常,则检查数据是否有误,或模型是否合适.6.(2015·重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20102011201220132014时间代号t12345储蓄存款y(千亿元)567810(1)求y关于t的回归方程=t+.(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.附:回归方程=t+中,niii1n22ii1tyntybaybt.tnt,【解题指南】(1)直接利用回归系数公式求解即可.(2)利用回归方程代入直接进行计算即可.【解析】(1)列表计算如下:itiyitiyi11515226412337921448163255102550∑153655120nniii1i1nn222ttityiii1i1tytt115136n5,tt3,yy7.2.n5n5tnt555310,tynty120537.212,121.2,10ayt7.21.233.6,这里又从而b-b-llll故所求回归方程为=1.2t+3.6.(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为=1.2×6+3.6=10.8(千亿元).【
本文标题:高中数学人教版选修12课时提升作业一11回归分析的基本思想及其初步应用探究导学课型W
链接地址:https://www.777doc.com/doc-5783005 .html