您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 2020版高中数学 第三章 统计案例本章整合课件 新人教A版选修2-3
-1-本章整合知识建构综合应用真题放送统计案例回归分析线性回归模型线性相关关系强弱的分析与判断散点图相关系数𝑟线性回归方程——最小二乘法𝑏^a^模型拟合效果分析残差分析——残差图𝑅2建立回归模型非线性回归模型——转化为线性回归模型独立性检验独立性检验的基本思想列联表图形法频率分析等高条形图随机变量𝐾2含义公式应用知识建构综合应用真题放送专题一专题二专题一回归分析的基本思想及其应用回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤是先画出两个变量的散点图,然后利用常见的函数模型去拟合样本点,拟合的效果如何常借助于R2去分析(或利用残差图去分析).知识建构综合应用真题放送专题一专题二应用1下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)x/吨3456y/吨标准煤2.5344.5𝑦^=b^x+𝑎^;知识建构综合应用真题放送专题一专题二提示:画出散点图,再进行回归分析.解:(1)由题意,作散点图如图.知识建构综合应用真题放送专题一专题二(2)由表中数据,计算得:∑𝑖=14xiyi=66.5,∑i=14𝑥𝑖2=32+42+52+62=86,𝑥=4.5,𝑦=3.5,𝑏^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,𝑎^=𝑦−𝑏^𝑥=3.5-0.7×4.5=0.35,所求的回归方程为𝑦^=0.7x+0.35.(3)当x=100时,y=100×0.7+0.35=70.35,预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨标准煤).知识建构综合应用真题放送专题一专题二应用2为研究质量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同质量的6个物体进行测量,数据如表所示:(1)作出散点图并求回归直线方程;(2)求出R2并说明回归模型拟合的程度;(3)进行残差分析.提示:本题考查残差分析,一般从以下几方面予以说明:(1)散点图;(2)相关系数;(3)R2;(4)残差图中的异常点和样本点的带状分布区域的宽窄.x/g51015202530y/cm7.258.128.959.9010.911.8知识建构综合应用真题放送专题一专题二解:(1)散点图如图.𝑥=16×(5+10+15+20+25+30)=17.5,𝑦=16×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487.∑𝑖=16xi2=2275,∑i=16xiyi=1076.2.计算得𝑏^≈0.183,𝑎^≈6.285.故所求回归直线方程为𝑦^=6.285+0.183x.知识建构综合应用真题放送专题一专题二(2)列表如下:(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高.由以上分析可知,弹簧长度与所挂物体的质量成线性关系.yi-y^i0.050.005-0.08-0.0450.040.025yi-y-2.237-1.367-0.5370.4131.4132.313∴∑𝑖=16(yi-y^𝑖)2≈0.01318,∑𝑖=16(yi-𝑦)2=14.6783.∴R2=1-0.0131814.6783≈0.9991,故回归模型的拟合效果较好.知识建构综合应用真题放送专题一专题二专题二独立性检验的思想及应用独立性检验的基本思想类似于数学中的反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值k很大,那么在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过概率P(K2≥k0)来评价该假设不合理的程度,由实际计算出的k,说明该假设不合理的程度,即“两个分类变量有关系”这一结论成立的可信程度.知识建构综合应用真题放送专题一专题二应用1某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.提示:本题考查独立性检验,作出2×2列联表,根据列联表数据作出等高条形图,对比乘积的差距判断两个分类变量是否有关系.解:作列联表如下:性格内向性格外向总计考前心情紧张332213545考前心情不紧张94381475总计4265941020知识建构综合应用真题放送专题一专题二相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.知识建构综合应用真题放送专题一专题二应用2考察小麦种子经灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表:试分析能否在犯错误的概率不超过0.05的前提下认为种子灭菌与小麦是否发生黑穗病有关.种子灭菌种子未灭菌总计黑穗病26184210无黑穗病50200250总计76384460知识建构综合应用真题放送专题一专题二提示:求出随机变量K2的观测值k进行判断.解:由列联表所示数据可求K2的观测值为由此可知,在犯错误的概率不超过0.05的前提下认为种子灭菌与小麦是否发生黑穗病有关系.k=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑)=460×(26×200-50×184)276×384×210×250≈4.8043.841.知识建构综合应用真题放送23141(2017·山东高考)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为𝑦^=b^𝑥+𝑎^.已知∑𝑖=110𝑥𝑖=225,∑𝑖=110𝑦𝑖=1600,𝑏^=4,该班某学生的脚长为24,据此估计其身高为()A.160B.163C.166D.170解析:由已知得𝑥=110∑𝑖=110𝑥𝑖=22.5,y=110∑i=110𝑦𝑖=160,又𝑏^=4,所以𝑎^=𝑦−𝑏^𝑥=160−4×22.5=70,故当𝑥=24时,𝑦^=4×24+70=166.故选C.答案:C知识建构综合应用真题放送23142(2018·全国Ⅱ高考)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.知识建构综合应用真题放送2314为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:𝑦^=−30.4+13.5𝑡;根据2010年至2016年的数据时间变量𝑡的值依次为1,2,…,7建立模型②:y^=99+17.5𝑡.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.知识建构综合应用真题放送2314解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为𝑦^=−30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为𝑦^=99+17.5×9=256.5(亿元).知识建构综合应用真题放送2314(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型𝑦^=99+17.5𝑡可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.知识建构综合应用真题放送2314(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可)知识建构综合应用真题放送23143(2018·全国Ⅲ高考改编)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.知识建构综合应用真题放送2314(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否在犯错误的概率不超过0.01的前提下认为两种生产方式的效率有差异?附:K2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑),P(K2≥k)0.0500.0100.001k3.8416.63510.828知识建构综合应用真题放送2314解:(1)第二种生产方式的效率更高.理由如下:①由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.②由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.③由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.知识建构综合应用真题放送2314④由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.以上给出了4种理由,答出其中任意一种或其他合理理由均可.知识建构综合应用真题放送2314(2)由茎叶图知m=79+812=80.列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(3)由于K2=40×(15×15-5×5)220×20×20×20=106.635,所以在犯错误的概率不超过0.01的前提下认为两种生产方式的效率有差异.知识建构综合应用真题放送23144(2017·全国Ⅱ高考改编)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单
本文标题:2020版高中数学 第三章 统计案例本章整合课件 新人教A版选修2-3
链接地址:https://www.777doc.com/doc-8104559 .html