您好,欢迎访问三七文档
核心素养提升练五十九变量间的相关关系与统计案例(30分钟60分)一、选择题(每小题5分,共25分)1.对于变量x,y有以下四个散点图,由这四个散点图可以判断变量x与y成负相关的是()【解析】选B.对于A,散点图呈片状分布,不具相关性;对于B,散点图呈带状分布,且y随x的增大而减小,是负相关;对于C,散点图中y随x的增大先增大再减小,不是负相关;对于D,散点图呈带状分布,且y随x的增大而增大,是正相关.2.某考察团对全国10大城市居民人均工资水平x(千元)与居民人均消费水平y(千元)进行统计调查,y与x具有相关关系,回归方程为=0.66x+1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为()A.83%B.72%C.67%D.66%【解析】选A.由7.675=0.66x+1.562,得x≈9.262,所以×100%≈83%.3.(2018·衡水模拟)如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强【解析】选B.去掉D点后,相关性变强,模型拟合效果越好,故残差平方和变小.4.根据如下样本数据得到的回归方程为=x+,若=5.4,则x每增加1个单位,y就()x34567y42.5-0.50.5-2A.增加0.9个单位B.减少0.9个单位C.增加1个单位D.减少1个单位【解析】选B.由题意可得=×(3+4+5+6+7)=5,=×(4+2.5-0.5+0.5-2)=0.9,因为回归方程为=x+,=5.4,且回归直线过点(5,0.9),所以0.9=5+5.4,解得=-0.9,所以x每增加1个单位,y就减少0.9个单位.5.观察两个变量(存在线性相关关系)得如下数据:x-10-6.99-5.01-2.983.9857.998.01y-9-7-5-34.014.9978则两变量间的线性回归方程为()A.=x+1B.=xC.=2x+D.=x+1【解析】选B.根据表中数据,得=(-10-6.99-5.01-2.98+3.98+5+7.99+8.01)=0,=(-9-7-5-3+4.01+4.99+7+8)=0.所以两变量x,y间的线性回归方程过样本中心点(0,0),只有B选项符合.【变式备选】已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是()A.=0.4x+2.3B.=2x-2.4C.=-2x+9.5D.=-0.3x+4.4【解析】选A.依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5),代入A,B得A正确.二、填空题(每小题5分,共15分)6.(2018·阜阳模拟)某班主任对全班30名男生进行了作业量多少的调查,数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏12820不喜欢玩电脑游戏2810总计141630该班主任据此推断男生认为作业多与喜欢玩电脑游戏有关系,则这种推断犯错误的概率不超过________.【解析】计算得K2的观测值k=≈4.2863.841,则推断犯错误的概率不超过0.05.答案:0.057.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温(℃)181310-1用电量(度)24343864由表中数据得回归直线方程=x+中的=-2,预测当气温为-4℃时,用电量约为________.【解析】根据题意知==10,==40,因为回归直线过样本点的中心,所以=40-(-2)×10=60,所以=-2x+60,当x=-4时,=(-2)×(-4)+60=68,所以当气温为-4℃时,用电量约为68度.答案:68度8.某炼钢厂废品率x(%)与成本y(元/吨)的线性回归方程为y=105.492+42.569x.当成本控制在176.5元/吨时,可以预计生产的1000吨钢中,约有________吨钢是废品(结果保留两位小数).【解析】因为176.5=105.492+42.569x,解得x≈1.668,即当成本控制在176.5元/吨时,废品率约为1.668%,所以生产的1000吨钢中,约有1000×1.668%=16.68吨是废品.答案:16.68【变式备选】经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的回归直线方程:=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】x变为x+1,=0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.答案:0.245三、解答题(每小题10分,共20分)9.已知某班n名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a,b,c成等差数列,且成绩在(90,100]内的有6人.(1)求n的值.(2)规定60分以下为不及格,若不及格的人中女生有4人,而及格的人中,男生比女生少4人,借助独立性检验分析在犯错误的概率不超过0.1的前提下是否可以认为“本次测试的及格情况与性别有关”?【解析】(1)依题意得b=0.01,因为成绩在(90,100]内的有6人,所以n=60.(2)由于2b=a+c,而b=0.01,可得a+c=0.02,则不及格的人数为0.02×10×60=12,及格的人数为60-12=48,于是本次测试的及格情况与性别的2×2列联表如下:及格不及格总计男22830女26430总计481260结合列联表计算可得K2的观测值k≈1.6672.706,故在犯错误的概率不超过0.1的前提下不能认为“本次测试的及格情况与性别有关”.【变式备选】某养鸡场为检验某种药物预防某种疾病的效果,取100只鸡进行对比试验,得到如下列联表(表中部分数据丢失,a,b,d,e,f,g表示丢失的数据):患病未患病总计未服用药ab50服用药15dg总计ef100工作人员记得2a=3b.(1)求出列联表中数据a,b,d,e,f,g的值.(2)能否在犯错误的概率不超过0.005的前提下认为药物有效?【解析】(1)因为a+b=50,2a=3b.所以a=30,b=20.由50+g=100,15+d=g,得g=50,d=35.所以,e=a+15=45,f=b+d=55.(2)由(1)可得K2的观测值k=≈9.0917.879.因此,在犯错误的概率不超过0.005的前提下认为药物有效.10.(2018·重庆模拟)第96届(春季)全国糖酒商品交易会于2017年3月23日至25日在四川举办,展馆附近一家四川特色小吃店为了研究参会人数与本店所需原材料数量的关系,在交易会前查阅了最近5次交易会的参会人数x(万人)与店铺所用原材料数量y(袋),得到如下数据:第一次第二次第三次第四次第五次参会人数x/万人11981012原材料y/袋2823202529(1)请根据所给五组数据,求出y关于x的线性回归方程=x+.(2)若该店现有原材料12袋,据悉本次交易会大约有13万人参加,为了保证原材料能够满足需要,则该店应至少再补充原材料多少袋?(参考公式:==,=-)【解析】(1)由数据,求得==10,==25,(xi-)(yi-)=1×3+(-1)×(-2)+(-2)×(-5)+0+2×4=23,(xi-)2=12+(-1)2+(-2)2+02+22=10,由公式,求得=2.3,=-·=2,y关于x的线性回归方程为=2.3x+2.(2)由x=13,得=31.9,而31.9-12=19.9≈20,所以,该店应至少再补充原材料20袋.【变式备选】为了研究男羽毛球运动员的身高x(单位:cm)与体重y(单位:kg)的关系,通过随机抽样的方法,抽取5名运动员测得他们的身高与体重关系如下表:身高(x)172174176178180体重(y)7473767577(1)从这5个人中随机地抽取2个人,求这2个人体重之差的绝对值不小于2kg的概率.(2)求回归直线方程=x+.【解析】(1)从这5个人中随机地抽取2个人的体重的基本事件有(74,73),(74,76),(74,75),(74,77),(73,76),(73,75),(73,77),(76,75),(76,77),(75,77).满足条件的有(74,76),(74,77),(73,76),(73,75),(73,77),(75,77)6种情况,故2个人体重之差的绝对值不小于2kg的概率为=.(2)=176,=75,xi--4-2024yi--1-2102===0.4,=-=4.6,所以=0.4x+4.6.(20分钟40分)1.(5分)已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程为=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是()A.b′,a′B.b′,a′C.b′,a′D.b′,a′【解析】选C.过(1,0)和(2,2)的直线方程为y=2x-2,画出六点的散点图,回归直线的大概位置如图所示,显然b′,a′.2.(5分)(2018·汕头模拟)某厂家为了解销售轿车台数与广告宣传费之间的关系,得到如表统计数据表:根据数据表可得回归直线方程=x+,其中=2.4,=-,据此模型预测广告费用为9万元时,销售轿车台数为()广告费用x/万元23456销售轿车y/台3461012A.17B.18C.19D.20【解析】选C.根据表中数据,计算=×(2+3+4+5+6)=4,=×(3+4+6+10+12)=7,且回归直线方程为=2.4x+,所以=-=7-2.4×4=-2.6,所以回归方程为=2.4x-2.6;当x=9时,=2.4×9-2.6=19,即据此模型预测广告费用为9万元时,销售轿车台数为19.3.(5分)已知回归直线斜率的估计值为1.23,样本点的中心为点(4,5),则回归直线的方程为________.【解析】回归直线必过点(4,5),所以y-5=1.23(x-4),所以=1.23x+0.08.答案:=1.23x+0.08【变式备选】已知回归直线方程为=4.4x+838.19,则可估计x与y增长速度之比约为________.【解析】x与y增长速度之比为=.答案:4.(12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断在犯错误的概率不超过0.1的前提下能否认为“生产能手与工人所在的年龄组有关”.【解析】(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,在样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B
本文标题:(黄冈名师)2020版高考数学大一轮复习 核心素养提升练五十九 11.3 变量间的相关关系与统计案例
链接地址:https://www.777doc.com/doc-8069767 .html