您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 2019-2018学年高中数学-第一章-统计案例本章整合课件-新人教A版选修1-2
本章整合第一章统计案例专题1专题2专题3专题4专题一回归分析1.对所抽取的样本数据进行分析,分析两个变量之间的关系——线性关系或非线性关系,并由一个变量的变化去推测另一个变量的变化,这就是对样本进行回归分析.回归分析的过程就是建立回归模型的过程.有时,回归模型可能会有多种选择(如作线性回归模型),这时,可通过残差分析或利用R2来检查模型的拟合效果,从而得到最佳模型.专题1专题2专题3专题4(3)由散点图确定回归方程的大致类型;(4)按一定规则估计回归方程中的参数;(5)得出结果后,可通过残差分析或利用R2来检查模型的拟合效果,从而得到最佳模型.2.回归分析的方法:回归模型法.基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系;专题1专题2专题3专题4应用1从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得∑𝑖=110𝑥𝑖=80,∑i=110𝑦𝑖=20,∑𝑖=110𝑥𝑖𝑦𝑖=184,∑𝑖=110𝑥𝑖2=720.(1)求家庭的月储蓄y对月收入x的线性回归方程𝑦^=𝑏^𝑥+𝑎^;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程𝑦^=𝑏^𝑥+𝑎^中,𝑏^=∑𝑖=1𝑛𝑥𝑖𝑦𝑖-𝑛𝑥𝑦∑𝑖=1𝑛𝑥𝑖2-𝑛𝑥2,𝑎^=𝑦−𝑏^𝑥,其中𝑥,𝑦为样本平均值.专题1专题2专题3专题4解:(1)由题意知n=10,𝑥=1𝑛∑𝑖=1𝑛𝑥𝑖=8010=8,y=1n∑i=1n𝑦𝑖=2010=2,又∑𝑖=1𝑛𝑥𝑖2−𝑛𝑥2=720-10×82=80,∑𝑖=1𝑛𝑥𝑖𝑦𝑖−𝑛𝑥𝑦=184-10×8×2=24,由此得𝑏^=2480=0.3,𝑎^=𝑦−𝑏^𝑥=2-0.3×8=-0.4,故所求回归方程为𝑦^=0.3x-0.4.(2)由于变量y的值随x的值增加而增加(𝑏^=0.30),故x与y之间是正相关.(3)将x=7代入回归方程,可以预测该家庭的月储蓄为𝑦^=0.3×7-0.4=1.7(千元).专题1专题2专题3专题4一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:编号12345678910零件数x/个102030405060708090100加工时间y/分钟626875818995102108115122(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差;(2)你认为这个模型能较好地刻画零件数和加工时间的关系吗?应用2专题1专题2专题3专题4提示:(1)依据样本点数据的散点图,可建立两个变量之间的回归模型;(2)画出残差图,依据残差点是否均匀地落在水平带状区域中进行判断.解:(1)根据表中数据作出散点图,如图所示.专题1专题2专题3专题4编号12345残差e^0.36-0.320-0.680.64编号678910残差e^-0.040.28-0.4-0.080.24专题1专题2专题3专题4(2)以零件数为横坐标,残差为纵坐标作出残差图如图所示.由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好.但需注意,由残差图也可以看出,第4个样本点和第5个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.专题1专题2专题3专题4专题二独立性检验1.独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法,常用的直观方法为等高条形图.等高条形图由于是等高的,因此它能直观地反映两个分类变量之间的差异的大小,而利用独立性检验的思想方法,计算出某一个随机变量K2的观测值来判断更精确些.2.独立性检验的基本思想类似于数学上的反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明假设不合理.专题1专题2专题3专题4应用1在一次恶劣气候的飞行中,某机构调查了男、女乘客在飞机上晕机的情况.共调查了89位乘客,其中男乘客有24人晕机,31人不晕机;女乘客有8人晕机,26人不晕机.根据此材料,能否在犯错误的概率不超过0.10的前提下认为“在本次飞机飞行中,晕机与性别有关系”?为什么?提示:首先列出2×2列联表,再计算K2的观测值k,与临界值比较,作出判断.解:由已知数据得到如下性别与晕机列联表(单位:人):晕机不晕机总计男乘客243155女乘客82634总计325789专题1专题2专题3专题4根据列联表得K2的观测值k=89×(24×26-31×8)255×34×32×57≈3.689.由于3.6892.706,故在犯错误的概率不超过0.10的前提下,认为“在本次飞机飞行中,晕机与性别有关系”.专题1专题2专题3专题4应用2某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试的成绩(满分100分),如下表所示:序号12345678910数学成绩95758094926567849871物理成绩90637287917158829381序号11121314151617181920数学成绩67936478779057837283物理成绩77824885699161847886若单科成绩85分以上(含85分),则该科成绩为优秀.专题1专题2专题3专题4(1)根据上表完成下面的2×2列联表(单位:人):数学成绩优秀数学成绩不优秀总计物理成绩优秀物理成绩不优秀总计20(2)根据(1)中表格的数据,能否在犯错误的概率不超过0.005的前提下,认为学生的数学成绩与物理成绩有关系?专题1专题2专题3专题4提示:根据题意,先合理提取已知数据完成2×2列联表,再进一步由表中数据计算K2的观测值,最后与临界值比较,作出判断.解:(1)填写2×2列联表(单位:人)如下:数学成绩优秀数学成绩不优秀总计物理成绩优秀527物理成绩不优秀11213总计61420(2)由列联表中的数据,得K2的观测值k=20×(5×12-1×2)27×13×6×14≈8.8027.879.因此在犯错误的概率不超过0.005的前提下,认为学生的数学成绩与物理成绩有关系.专题1专题2专题3专题4专题三转化与化归思想在回归分析过程中,由于两个变量间的关系可能是线性关系,也可能是二次函数型、指数函数型、对数函数型等中的一种.对于前者,我们可以借助线性回归模型来处理;对于后者,在解答过程中,我们常利用变量间的转换,把非线性回归问题化成线性回归问题,最终用线性回归方程进行研究.应用炼钢厂出钢时所用的盛钢水的钢包,在使用过程中,由于钢液及炉渣对包衬耐火材料的侵蚀,使其容积不断增大,请根据表格中的数据找出使用次数x与增大的容积y之间的关系.专题1专题2专题3专题4使用次数x23456789增大的容积y6.428.209.589.509.7010.009.939.99使用次数x10111213141516增大的容积y10.4910.5910.6010.8010.6010.9010.76解:根据试验数据作散点图,如下图.从图中可以看出x与y之间不存在线性相关关系.但仔细分析一下,知道钢包开始使用时侵蚀速度快,然后逐渐减慢.显然,钢包容积不会无限增大,它必有一条平行于x轴的渐近线.于是根据这一特点,我们试设指数型函数曲线y=𝑎e𝑏𝑥.对它两边取对数得lny=lna+𝑏𝑥.专题1专题2专题3专题4t=1x0.500.33330.250.200.16670.14290.12500.1111z=lny1.85942.10412.25972.25132.27212.30262.29562.3016t=1x0.100.09090.08330.07690.07140.06670.0625z=lny2.35042.35992.36092.37952.36092.38882.3758c,b的最小二乘估计𝑏^≈-1.1107,c^=𝑧−𝑏^𝑡≈2.4578.由此得𝑎^=e𝑐^≈11.6791,故𝑦^=11.6791𝑒-1.1107x.令z=lny,t=1𝑥,c=lna,则上式可写为线性方程:z=c+bt,t,z的数值对应表为:专题1专题2专题3专题4专题四数形结合思想数形结合思想的实质是将抽象的数学语言与直观的图象结合起来,将代数问题与几何问题之间进行转化,包括“以数辅形”和“以形助数”两个方面.在本章常用的图形为散点图、残差图与等高条形图.应用为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:父母吸烟父母不吸烟总计子女吸烟23783320子女不吸烟6785221200总计9156051520专题1专题2专题3专题4(1)作出等高条形图,并对子女吸烟与父母吸烟的关系作出简要分析;(2)能否在犯错误的概率不超过0.001的前提下,认为父母吸烟对子女吸烟有影响?解:(1)作出等高条形图如下图所示:由图形可以看出,子女吸烟者中父母吸烟的比例要比子女不吸烟者中父母吸烟的比例高,因此可以在某种程度上认为子女吸烟与父母吸烟有关.专题1专题2专题3专题4由图形可以看出,子女吸烟者中父母吸烟的比例要比子女不吸烟者中父母吸烟的比例高,因此可以在某种程度上认为子女吸烟与父母吸烟有关.123451(2015·课标全国Ⅱ高考)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2019年减少二氧化硫排放量的效果最显著B.2019年我国治理二氧化硫排放显现成效C.2019年以来我国二氧化硫年排放量呈减少趋势D.2019年以来我国二氧化硫年排放量与年份正相关12345解析:由柱形图知,2019年以来我国二氧化硫年排放量呈减少趋势,故其排放量与年份负相关.答案:D123452(2019·湖北高考)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y负相关,x与z负相关B.x与y正相关,x与z正相关C.x与y正相关,x与z负相关D.x与y负相关,x与z正相关解析由y=-0.1x+1知y与x负相关,又因为y与z正相关,故z与x负相关.答案A123453(2019·全国丙高考)下图是我国2019年至2019年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1—7分别对应年份2019—2019.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量.12345附注:参考数据:∑𝑖=17𝑦𝑖=9.32,∑i=17𝑡𝑖𝑦𝑖=40.17,∑𝑖=17(𝑦𝑖-𝑦)2=0.55,7≈2.646.参考公式:相关系数r=∑𝑖=1𝑛(𝑡𝑖-𝑡)(𝑦𝑖-𝑦)∑𝑖=1𝑛(𝑡𝑖-𝑡)2∑𝑖=1𝑛(𝑦𝑖-𝑦)2,回归方程𝑦^=𝑎^+𝑏^𝑡中斜率和截距最小二乘估计公式分别为:𝑏^=∑𝑖=1𝑛(𝑡𝑖-𝑡)(𝑦𝑖-𝑦)∑𝑖=1𝑛(𝑡𝑖-𝑡)2,𝑎^=𝑦−𝑏^𝑡.12345解(1)由折线图中数据和附注中参考数据得𝑡=4,∑𝑖=17(𝑡𝑖−t)2=28,∑i=17(𝑦𝑖-𝑦)2=0.55,∑𝑖=17(𝑡𝑖−𝑡)(𝑦𝑖−𝑦)=∑𝑖=17𝑡𝑖𝑦𝑖−𝑡∑𝑖=17𝑦𝑖=40.17-4×9.32=2.89.r≈2.890.55×2×2.646≈0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.12
本文标题:2019-2018学年高中数学-第一章-统计案例本章整合课件-新人教A版选修1-2
链接地址:https://www.777doc.com/doc-6079227 .html