您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 【成才之路】2015-2016学年高中数学-第3章-1回归分析课件-北师大版选修2-3
成才之路·数学路漫漫其修远兮吾将上下而求索北师大版·选修2-3统计案例第三章本章知识概述本章内容是新课标教材的新增内容,目的是通过案例介绍一些统计方法,体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.因此高考试题中注重的是统计思想,所涉及的数据计算不会很繁琐.本章的重点是:回归分析与独立性检验的基本思想与方法;难点是:回归分析与独立性检验的初步应用.学习时,应注意以下几点:1.注意用最小二乘法建立变量之间线性回归方程的方法的复习,理解用散点图判断变量之间近似成线性相关关系及用线性相关系数刻画变量之间线性相关程度.2.非线性回归方程可转化为线性回归方程来解决,转化时要熟悉几种常见的函数拟合模型,理解非线性方程与线性方程变量间的关系.3.牢记统计量χ2的计算公式,理解独立性检验的思想,对实际问题作出统计推断.§1回归分析第三章课堂典例探究2课时作业3课前自主预习1课前自主预习1.通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.2.通过求线性回归方程,探究相关性检验的基本思想.3.通过对典型案例的探究,体会回归分析在生产实践和日常生活中的广泛应用.本节重点:回归直线方程相关系数和可线性化的回归分析.本节难点:通过相关性的检验,对实际问题进行回归分析.1.线性回归分析的步骤(1)画出两个变量的_________;(2)求_______________;(3)由线性回归方程进行_____.2.线性回归方程系数的计算公式设变量y对x的线性回归方程为y=a+bx,由最小二乘法知系数a、b的计算公式为:散点图线性回归方程预测b=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nxyi=1nx2i-nx2,a=y-bx.3.相关系数假设两个随机变量的数据分别为(x1,y1)、(x2,y2)、…、(xn,yn),则变量间线性相关系数r的计算公式如下:r=i=1nxi-xyi-yi=1nxi-x2i=1nyi-y2=i=1nxiyi-nxyi=1nx2i-nx2i=1ny2i-ny2.变量之间线性相关系数r具有如下性质:(1)r2≤1,故变量之间线性相关系数r的取值范围为[-1,1].(2)|r|值越大,变量之间的__________________;|r|值越接近0,变量之间的_________________.(3)当r0时,两个变量的值总体上呈现出同时增减的趋势,此时称两个变量________;当r0时,一个变量增加,另一个变量有减少的趋势,称两个变量_________;当r=0时,称两个_________________.线性相关程度越高线性相关程度越低正相关负相关变量线性不相关4.可线性化的回归分析1.在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要根据散点图选择适当的函数模型来拟合观测数据,然后通过适当的变量代换,把非线性问题转化为线性问题,从而确定未知参数,建立相应的线性回归方程.2.常见的非线性回归模型转化为线性回归模型如下:(1)幂函数曲线y=axb作变换u=lny,v=lnx,c=lna,得线性函数u=c+bv.(2)指数曲线y=aebx作变换u=lny,c=lna,得线性函数u=c+bx.(3)倒指数曲线y=aebx作变换u=lny,c=lna,v=1x,得线性函数u=c+bv.(4)对数曲线y=a+blnx作变换u=y,v=lnx,得线性函数u=a+bv.1.散点图直观地反映了事物的成对观测值之间是否存在相关关系和什么样的相关关系,如果所有点看上去都在一条直线附近波动,则变量间是线性相关,可以用一条直线来近似表示;若在某条曲线附近波动,则称非线性相关,可以用一条曲线来拟合;若没有显示任何关系,则称不相关.2.两个变量具有相关关系和两个变量具有函数关系的区别相关关系与函数关系不同,因为函数关系是一种确定性的关系,而相关关系是一种非确定性的关系,它包括两种情况:一是两个变量中,一个变量为可控制变量,另一个变量为随机变量;二是两个变量均为随机变量.而函数关系可以看成是两个非随机变量之间的关系.另一方面,函数关系是一种因果关系.而相关关系不一定是因果关系,也可以是伴随关系.对两个变量的关系来说,在相关关系中,例如,在水稻产量与施肥量的关系中,施肥量是可控制变量,而水稻的产量是随机变量;在研究一个学生的数学成绩与物理成绩的关系时,这两个变量都是不可控制的随机变量.而正方形的面积S与边长x之间的关系是一种函数关系,这两个变量就不是随机变量.由于相关关系的不确定性,我们经常运用统计分析的方法,即回归分析法来进行研究.我们可以知道,相关关系中,由部分观测值得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性问题转化成确定性问题来研究.由于回归直线将部分观测值所反映的规律性进行了延伸,它在情况预报、资料补充等方面有着广泛的应用,从某种意义上看,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可使我们处理更为广泛的数学应用问题,还会使我们对函数关系的认识上升到一种新的高度.3.在线性回归方程y=a+bx中,当一次项系数b为正数时,我们就称这两个变量正相关,在散点图上自左至右看就是这些点呈上升的趋势;当b为负数时,就称这两个变量负相关,在散点图上自左至右看就是这些点呈下降的趋势.4.回归直线方程y=a+bx其中:b=i=1nxi-xyi-yi=1nxi-x2,其统计学意义是:x每增(减)一个单位,y平均改变b个单位;a=y--bx-,它的意义是y不受x变化影响的部分.5.(1)按照最小二乘法,建立y关于x的线性回归方程和x关于y的线性回归方程得到的结果一般来说是不相同的,即x和y不是对称的,所以建立回归方程时,首先要分清x和y,不要混淆.(2)线性回归分析的方法、步骤利用回归分析的方法对具有线性相关关系的变量进行研究的步骤为:①画出两个变量的散点图;②求回归直线方程;③用回归直线方程进行预报.其中求回归直线的方程是关键.而求回直线的最好方法是“最小二乘法”,即对于线性回归模型y=bx+a来说,估计模型中的未知参数a和b的最好方法就是用最小二乘法估计a和b,其计算公式为b=i=1nxi-x-yi-y-i=1nxi-x-2=i=1nxiyi-nx-y-i=1nx2i-nx-2,a=y--bx-.1.(2014·天门市调研)下图是根据变量x,y的观测数据(xi,yi)(i=1,2,…,10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④[答案]D[解析]根据散点图中点的分布情况,可判断③④中的变量x,y具有相关的关系.2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有()A.a与r符号相同B.a与r符号相反C.b与r符号相同D.b与r符号相反[答案]C[解析]根据b与r的计算公式可知,b与r符号相同.3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y^=0.85x-85.71,则下列结论中不正确...的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x-,y-)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg[答案]D[解析]本题考查线性回归方程.D项中身高为170cm时,体重“约为”58.79,而不是“确定”,回归方程只能作出“估计”,而非确定“线性”关系.4.在两个变量的回归分析中,作散点图的目的是________;相关系数是度量________的量.[答案]从散点图中看出数据的大致规律,再根据这个规律选择适当的函数进行拟合两个变量之间线性相关程度5.在线性回归模型中,线性回归方程y=a+bx一定经过点________.[答案](x,y)[解析]线性回归方程必定经过样本中心点(x,y).课堂典例探究相关性检验弹簧长度y(cm)随所挂物体的重量x(g)不同而变化的情况如下:x51015202530y7.258.128.959.9010.9611.80(1)画出散点图;(2)求y对x的回归直线方程;(3)预测所挂物体重量为27g时的弹簧长度(精确到0.01cm).[解析](1)散点图如图所示:(2)采用列表的方法计算a与回归系数b.序号xyx2xy157.252536.252108.1210081.23158.95225134.254209.9040019852510.9662527463011.80900354x-=16×(50+10+…+30)=17.5,y-=16×(7.25+8.12+…+11.80)≈9.50,∑x2i=25+100+…+900=2275,∑xiyi=36.25+81.2+…+354=1077.7,b=1077.7-6×17.5×9.502275-6×17.52≈0.183,a=9.50-0.183×17.5≈6.30.y对x的回归直线方程为y=a+bx=6.30+0.183x.(3)当质量为27g时,有y=6.30+0.183×27≈11.24(cm).故当挂物体质量为27g时,弹筑的长度大约为11.24cm.某企业想通过做广告来提高自己的知名度,经预测可知本企业产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070(1)判断y与x是否具有线性相关关系;(2)求回归直线方程.[分析]先画出散点图,即可判断y与x是否具有相关关系,如果y与x具有相关关系可将有关数据代入公式可求得回归直线方程.[解析](1)散点图如图所示:根据散点图可知,所给的数据点都在一条直线的附近,所以y与x具有线性相关关系.(2)列出下表,并且科学地的进行有关计算.i12345xi24568yi3040605070xiyi60160300300560x-=5,y-=50,5i=1x2i=145,5i=1y2i=135000,5i=1xiyi=1380于是可得,b=5i=1xiyi-5x-y-5i=1x2i-5x-2=1380-5×5×50145-5×52=6.5,a=y--bx-=50-6.5×5=17.5,于是所求的回归直线方程是y=6.5x+17.5.非线性回归问题的求解方法在一化学反应过程中某化学物质的反应速度Y(单位:g/分)与一种催化剂的量x(单位:g)有关,现收集了8组数据列于表中,试建立Y与x之间的回归方程.催化剂量x/g1518212427303336化学物质反应速度Y(g/分)6830277020565350[分析]解答本题可先由表中数据作出散点图,并通过散点图来分析两个变量间的关系;若两个变量间的关系是非线性的,要结合必修1中的函数模型的应用来选择函数,然后利用变量代换化为直线型,从而解决问题.[解析]根据收集的数据作散点图:根据样本点分布情况,可选用两种曲线模型来拟合.(1)可认为样本点集中在某二次曲线y=c1x2+c2的附近.令t=x2,则变换后样本点应该分布在直线y=bt+a(b=c1,a=c2)的周围.由题意得变换后t与Y的样本数据表:t22532444157672990010891296Y6830277020565350由Y与t的散点图可观察到样本数据点并不分布在一条直线的周围,因此不宜用线性回归方程y=bt+a来拟合,即不宜用二次曲线y=c1x2+c2来拟合Y与x之间的关系.(2)根据x与y的散点图也可以认为样本点集中在某一条指数型函数曲线y=c1ec2x的周围.令z=lny,则z=c2x+lnc1,即变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围,由Y与x数据表可得Z与x的数据表:x15182
本文标题:【成才之路】2015-2016学年高中数学-第3章-1回归分析课件-北师大版选修2-3
链接地址:https://www.777doc.com/doc-7534838 .html