您好,欢迎访问三七文档
章末归纳整合在研究两个变量之间的关系时,可以先根据散点图来粗略地判断它们是否存在线性相关关系,是否可以用线性回归模型来拟合两个变量的关系,如果可以用线性回归模型来拟合时,再求出回归直线方程,最后再作残差分析来判断拟合的效果,并判断原始数据中是否存在可疑数据.回归分析【例1】一个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下表:零件数x/个102030405060708090100加工时间y/min627275818595103108112127(1)画出散点图,并初步判断是否线性相关;(2)若线性相关,求回归直线方程;(3)求出相关指数;(4)作出残差图;(5)进行残差分析;(6)试制订加工200个零件的用时规定.解:(1)散点图,如图所示.由图可知x,y线性相关.(2)x与y的关系可以用线性回归模型来拟合,不妨设回归模型为y^=a^+b^x.将数据代入相应公式可得数据表:序号零件个数xi/个加工时间yi/minxiyix2i110626201002207214404003307522509004408132401600550854250250066095570036007701037210490088010886406400990112100808100101001271270010000∑5509205613038500∴x=55,y=92.∴b^=i=110xiyi-10xyi=110x2i-10x2=56130-10×55×9238500-10×552=553825≈0.670.∴a^=y-b^x=92-553825×55=82715≈55.133.∴回归方程为y^=0.670x+55.133.(3)利用所求回归方程求出下列数据:∴R2=1-i=110yi-y^i2i=110yi-y2≈0.983.(4)∵e^i=yi-y^i,利用上表中数据作出残差图,如图所示.(5)由散点图可以看出x与y有很强的线性相关性,由R2的值可以看出回归效果很好.由残差图也可观察到,第2,5,9,10个样本点的残差比较大,需要确认在采集这些样本点的过程中是否有人为的错误.(6)将x=200代入回归方程,得y^≈189.∴可以制订189分钟加工200个零件的规定.方法点评:与函数关系不同,相关关系是一种非确定性关系,对具有相关关系的两个变量进行统计分析的方法叫做回归分析,一元线性回归分析是回归分析中最简单的一种,它不仅有着广泛的应用,而且是进一步学习回归分析的基础.一些非线性回归问题可转化成线性回归问题来解决.所谓一元线性回归分析,就是其回归方程为y^=b^x+a^的形式,类似地,回归方程还有y^=a+bx+ε,y^=Aebx(A,b为常数),y^=xb+ax等多种形式.求一元线性回归方程的步骤是先作出散点图,看这些散点是否分布在某条直线的附近,如果是,就只需将题目的数据代入公式b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x(其中x=1ni=1nxi,y=1ni=1nyi)即可.1.为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下:(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图;(2)求y与x之间的回归方程;(3)计算残差,相关指数R2,并描述解释变量与预报变量之间的关系.时间x/天123456繁殖个数y/个612254995190【解析】(1)散点图如下图所示.(2)由散点图看出样本点分布在一条指数函数y=c1ec2x的周围,于是令z=lny,则x123456z1.792.483.223.894.555.25由计算器算得相关系数r≈0.9999,所以z与x有很强的线性相关关系.因此,得z^=0.6909x+1.112,则有y^=e0.6909x+1.112.(3)i=16(yi-y^i)2=6.7265,i=16(yi-y-)2≈24642.83,R2=1-6.726524642.83≈0.9997.解释变量x很好地对预报变量y作出了解释,时间解释了99.9%的繁殖个数变化.独立性检验在日常生活中,经常会面临一些需要推断的问题,在对这些问题作出推断时,我们不能仅凭主观意愿作出结论,需要通过试验来收集数据,并依据独立性检验的原理作出合理的推断,这就是独立性检验的基本思想,依据这一思想,我们可以考察两个分类变量X和Y是否有关系,并且能给出这种判断的可靠程度,其基本做法是:计算统计量K2=nad-bc2a+bc+da+cb+d,当得到的观测数据a,b,c,d都不小于5时,可以通过查阅下表来断言“X与Y有关系”的犯错误概率.当K2很大时,就认为两个分类变量X和Y有关系;而若K2<2.706,就认为没有充分的证据显示“X与Y有关系”.P(K2≥k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828【例2】某保健药品推销员为推销某保健药品,在广告中宣传:“在服用该药品的105人中有100人未患A疾病”.经调查发现,在不使用该药品的418人中仅有18人患A疾病.请用所学知识分析该药品对预防A疾病是否有效?解:将问题中的数据写成2×2列联表:组别患病不患病合计使用5100105不使用18400418合计23500523将上述数据代入公式K2=nad-bc2a+bc+da+cb+d中,计算可得K2≈0.04145.而查表可知P(K2≥0.445)≈0.5.故没有充分理由认为该保健药品对预防A疾病有效.方法点评:利用独立性检验可以帮助我们定量地分析两个分类变量之间是否有关系,其基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的.2.心理学家分析发现视觉和空间能力与性别有关,某数学兴趣小组为了验证这个结论,从兴趣小组中按分层抽样的方法抽取50名同学(男30女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)性别几何题代数题总计男同学22830女同学81220总计302050若认为选几何题的同学具有较好的视觉和空间能力,能否据此判断有97.5%的把握认为视觉和空间能力与性别有关?【解析】由表中数据得K2的观测值k=50×22×12-8×8230×20×30×20=509≈5.556>5.024,所以根据统计有97.5%的把握认为视觉和空间能力与性别有关.回归分析和独立性检验是应用数学解决实际问题的重要内容,能很好地考查分析问题并解决问题的能力,在近年高考中都有重点考查,常与统计、概率等知识综合考查.1.(2017年山东)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为y^=b^x+a^.已知i=110xi=225,i=110yi=1600,b^=4.该班某学生的脚长为24,据此估计其身高为()A.160B.163C.166D.170【答案】C【解析】x=110i=110xi=22.5,y-=110i=110yi=160,所以a^=160-4×22.5=70.当x=24时,y^=4×24+70=166.故选C.2.(2019年新课标Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2k)0.0500.0100.001k3.8416.63510.828【解析】(1)用频率估计概率,男顾客对该商场服务满意的概率为4050=45;女顾客对该商场服务满意的概率为3050=35.(2)由题意可知,K2=100×(40×20-30×10)270×30×50×50=10021≈4.7623.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.3.(2018年新课标Ⅱ)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y^=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y^=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?请说明理由.【解析】(1)对于模型①,当t=19时,y^=-30.4+13.5×19=226.1,即该地区2018年的环境基础设施投资额的预测值是226.1亿元.对于模型②,当t=9时,y^=99+17.5×9=256.5,即该地区2018年的环境基础设施投资额的预测值是256.5亿元.(2)模型②得到的预测值更可靠.∵从总体数据看,该地区从2000年到2016年的环境基础设施投资额是逐年上升的,而从2000年到2009年间递增的幅度较小些,从2010年到2016年间递增的幅度较大些,∴利用模型②的预测值更可靠些.
本文标题:2019-2020学年高中数学 第三章 统计案例章末归纳整合课件 新人教A版选修2-3
链接地址:https://www.777doc.com/doc-8287804 .html