您好,欢迎访问三七文档
专题十六《统计与统计案例》讲义16.2统计案例题型一.一元线性回归模型1.某车间为了规划生产进度提高生产效率,记录了不同时段生产零件个数x(百个)与相应加工总时长y(小时)的几组对应数据,根据表中提供的数据,求出y关于x的线性回归方程为𝑦^=0.7x+0.05,则下列结论错误的是()x2345y1.52m3.5A.加工总时长与生产零件数呈正相关B.该回归直线一定过点(3.5,2.5)C.零件个数每增加1百个,相应加工总时长约增加0.7小时D.m的值是2.85【解答】解:由题意,线性回归方程为𝑦^=0.7x+0.05,对于A:∵b=0.7>0,∴加工总时长与生产零件数呈正相关;对于B:当x=3.5时,可得y=0.7×3.5+0.05=2.5,即该回归直线一定过点(3.5,2.5)对于C:由b=0.7,∴零件个数每增加1百个,相应加工总时长约增加0.7小时,对于D:回归方程过平均中心,𝑥=2+3+4+54=3.5,𝑦=1.5+2+𝑚+3.54=2.5.解得:m=3故选:D.2.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为𝑦̂=𝑏̂𝑥+𝑎̂.已知∑10𝑖=1𝑥𝑖=225,∑10𝑖=1𝑦𝑖=1600,𝑏̂=4.该班某学生的脚长为23,据此估计其身高为()A.160B.162C.166D.170【解答】解:因为∑10𝑖=1𝑥𝑖=225,∑10𝑖=1𝑦𝑖=1600,𝑏̂=4,则𝑥=22510=22.5,𝑦=160010=160,所以𝑎̂=𝑦−𝑏̂𝑥=160−4×22.5=70,所以线性回归方程为𝑦̂=4x+70,当x=23时,𝑦̂=4×23+70=162,所以该班某学生的脚长为23,估计其身高为162厘米.故选:B.3.(2020•新课标Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+blnx【解答】解:由散点图可知,在10℃至40℃之间,发芽率y和温度x所对应的点(x,y)在一段对数函数的曲线附近,结合选项可知,y=a+blnx可作为发芽率y和温度x的回归方程类型.故选:D.4.(2018•新课标Ⅱ)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:𝑦̂=−30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:𝑦̂=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【解答】解:(1)根据模型①:𝑦̂=−30.4+13.5t,计算t=19时,𝑦̂=−30.4+13.5×19=226.1;利用这个模型,求出该地区2018年的环境基础设施投资额的预测值是226.1亿元;根据模型②:𝑦̂=99+17.5t,计算t=9时,𝑦̂=99+17.5×9=256.5;利用这个模型,求该地区2018年的环境基础设施投资额的预测值是256.5亿元;(2)解法1:模型②得到的预测值更可靠,因为从总体数据看,该地区从2000年到2016年的环境基础设施投资额是逐年上升的,从2000年到2009年间递增的幅度较小些,从2010年到2016年间递增的幅度较大些,所以利用模型②的预测值更可靠些.解法2,模型②对应的7个点分布宽度小于模型①对应的17个点的分布宽度,则|r2|>|r1|,所以模型②较好;解法3,选择与2018邻近的三个年份(2014,2015,2016)计算模型②对应的残差绝对值之和=2.5+5+1.5=9,模型①对应的残差绝对值之和=12+23.5+21=56.5;且9<56.5,所以模型②较好;所以利用模型②的预测值更可靠些.5.(2016•新课标Ⅲ)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1﹣7分别对应年份2008﹣2014.(Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明;(Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑7𝑖=1yi=9.32,∑7𝑖=1tiyi=40.17,√∑7𝑖=1(𝑦𝑖−𝑦)2=0.55,√7≈2.646.参考公式:相关系数r=∑𝑛𝑖=1(𝑡𝑖−𝑡)(𝑦𝑖−𝑦)√∑𝑛𝑖=1(𝑡𝑖−𝑡)2∑𝑛𝑖=1(𝑦𝑖−𝑦)2,回归方程𝑦̂=𝑎̂+𝑏̂t中斜率和截距的最小二乘估计公式分别为:𝑏̂=∑𝑛𝑖=1(𝑡𝑖−𝑡)(𝑦𝑖−𝑦)∑𝑛𝑖=1(𝑡𝑖−𝑡)2,𝑎̂=𝑦−𝑏̂𝑡.【解答】解:(1)由折线图看出,y与t之间存在较强的正相关关系,理由如下:∵r=∑7𝑖=1(𝑡𝑖−𝑡)(𝑦𝑖−𝑦)√∑7𝑖=1(𝑡𝑖−𝑡)2∑7𝑖=1(𝑦𝑖−𝑦)2=∑7𝑖=1𝑡𝑖𝑦𝑖−7𝑡𝑦√∑7𝑖=1(𝑡𝑖−𝑡)2∑7𝑖=1(𝑦𝑖−𝑦)2≈40.17−4×9.322√7⋅0.55≈2.892.9106≈0.99,∵0.99>0.75,故y与t之间存在较强的正相关关系;(2)𝑏̂=∑𝑛𝑖=1(𝑡𝑖−𝑡)(𝑦𝑖−𝑦)∑𝑛𝑖=1(𝑡𝑖−𝑡)2=∑7𝑖=1𝑡𝑖𝑦𝑖−7𝑡𝑦∑7𝑖=1𝑡𝑖2−7𝑡2≈2.8928≈0.10,𝑎̂=𝑦−𝑏̂𝑡≈1.33﹣0.10×4≈0.93,∴y关于t的回归方程𝑦̂=0.10t+0.93,2016年对应的t值为9,故𝑦̂=0.10×9+0.93=1.83,预测2016年我国生活垃圾无害化处理量为1.83亿吨.6.(2018秋•岳麓区校级月考)越接近高考学生焦虑程度越强,四个高三学生中大约有一个有焦虑症,经有关机构调查,得出距离高考周数与焦虑程度对应的正常值变化情况如下表:周数x654321正常值y556372809099(1)作出散点图:(2)根据上表数据用最小二乘法求出y关于x的线性回归方程𝑦̂=𝑏̂x+𝑎̂(精确到0.01);(3)根据经验,观测值为正常值的0.85~1.06为正常,若1.06~1.12为轻度焦虑,1.12~1.20为中度焦虑,1.20及其以上为重度焦虑,若为中度焦虑及其以上,则要进行心理疏导,若一个学生在距高考第二周时观测值为100,则该学生是否需要进行心理疏导?其中𝑏̂=∑𝑛𝑖=1𝑥𝑖𝑦𝑖−𝑛𝑥𝑦∑𝑛𝑖=1𝑥𝑖2−𝑛𝑥2,∑6𝑖=1xiyi=1.452,∑6𝑖=1x𝑖2=91,𝑎̂=𝑦−𝑏̂𝑥.【解答】解:(1)(2)𝑥=16(6+5+4+3+2+1)=3.5,𝑦=16(55+63+72+80+90+99)=76.5,𝑥𝑦=267.75,𝑏̂=1452−6×267.7591−6×3.52≈−8.83,𝑎̂=76.5+8.83×3.5≈107.41,∴线性回归方程为y=﹣8.83x+107.41;(3)x=2时,y=﹣8.83×2+107.41≈89.74,∵10089.74≈1.11<1.12,为轻度焦虑,故该学生不需要进行心理疏导.7.(2020秋•昌江区校级期中)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到如图的散点图及一些统计量的值.𝑥𝑦𝑤∑8𝑖=1(xi−𝑥)2∑8𝑖=1(wi−𝑤)2∑8𝑖=1(xi−𝑥)(yi−𝑦)∑8𝑖=1(wi−𝑤)(yi−𝑦)46.65636.8289.81.61469108.8表中𝑤𝑖=√𝑥𝑖,𝑤=18∑8𝑖=1𝑤𝑖.附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βμ的斜率和截距的最小二乘估计分别为𝛽̂=∑𝑛𝑖=1(𝑢𝑖−𝑢)(𝑣𝑖−𝑣)∑𝑛𝑖=1(𝑢𝑖−𝑢)2,𝛼̂=𝑣−𝛽̂𝑢.(1)根据散点图判断y=a+bx和y=c+d√𝑥哪一个适宜作为销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x、y的关系为z=0.2y﹣x,根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?【解答】解:(1)由散点图可以判断,y=c+d√𝑥适宜作为年销售量y关于年宣传费x的回归方程类型;(2)令w=√𝑥,先建立y关于w的线性回归方程,由于d=108.61.6=68,c=𝑦−d𝑤=563﹣68×6.8=100.6,∴y关于w的线性回归方程为y=100.6+68w,因此y关于x的回归方程为y=100.6+68√𝑥;(3)①由(2)知,当x=49时,年销售量y的预报值y=100.6+68√49=576.6,年利润z的预报值z=576.6×0.2﹣49=66.32;②根据(2)的结果可知,年利润z的预报值z=0.2(100.6+68√𝑥)﹣x=﹣x+13.6√𝑥+20.12,当√𝑥=13.62=6.8时,即x=46.24时年利润的预报值最大.声明:试题解析著作权属所有,未经书面同意,不得复制发布题型二.独立性检验1.某医疗研究所为了检验新开发的流感疫苗对甲型Hln1流感的预防作用,把1000名注射了疫苗的人与另外1000名未注射疫苗的人的半年的感冒记录作比较,提出假设H0:“这种疫苗不能起到预防甲型Hln1流感的作用”,并计算出P(Χ2≥6.635)≈0.01,则下列说法正确的是()A.这种疫苗能起到预防甲型Hln1流感的有效率为1%B.若某人未使用该疫苗,则他在半年中有99%的可能性得甲型Hln1C.有1%的把握认为“这种疫苗能起到预防甲型Hln1流感的作用”D.有99%的把握认为“这种疫苗能起到预防甲型Hln1流感的作用”【解答】解:∵并计算出P(Χ2≥6.635)≈0.01,这说明假设不合理的程度约为99%,即这种疫苗不能起到预防甲型Hln1流感的作用不合理的程度约为99%,∴有99%的把握认为“这种疫苗能起到预防甲型Hln1流感的作用”故选:D.2.通过随机询问200名性别不同的大学生是否爱好踢毽子运动,计算得到统计量K2的观测值k≈4.892,参照附表,得到的正确结论是()P(K2≥k)0.100.050.025k2.7063.8415.024A.有97.5%以上的把握认为“爱好该项运动与性别有关”B.有97.5%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关”【解答】解:∵计算得到统计量值K2的观测值k≈4.892>3.841,参照题目中的数值表,得到正确的结论是:在犯错误的概率不超过5%的前提下,认为“爱好该运动与性别有关”.故选:C.3.某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满
本文标题:【新高考复习】专题16统计与统计案例 16.2统计案例 题型归纳讲义-2022届高三数学一轮复习(解
链接地址:https://www.777doc.com/doc-12780542 .html