您好,欢迎访问三七文档
第一章统计案例1.2回归分析学习目标核心素养1.会用散点图分析两个变量是否存在相关关系.(重点)2.会求回归方程、掌握建立回归模型的步骤,会选择回归模型.(重点、难点)1.通过回归分析学习,培养学生数据分析、数学建模素养.2.借助求回归方程及相关系数r的值,提升学生的数学运算素养.自主预习探新知一、线性回归模型1.回归直线方程其中b^的计算公式还可以写成b^=∑xiyi-nx-y-∑x2i-nx-2.2.线性回归模型y=bx+a+εi,其中εi称为,a和b是模型的未知参数,自变量x称为,因变量y称为.预报变量随机误差项解释变量二、相关性检验1.相关系数计算r=∑xi-x-yi-y-∑xi-x-2∑yi-y-2=∑xiyi-nx-y-∑x2i-nx-2∑y2i-ny-2范围|r|≤1性质线性相关程度|r|越接近1,线性相关程度越强|r|越接近0,线性相关程度越弱2.相关性检验的步骤(1)作统计假设:x与Y线性相关关系;(2)根据小概率0.05与n-2在附表中查出r的一个临界值r0.05;(3)根据样本相关系数计算公式算出r的值;(4)作统计推断.如果|r|r0.05,表明有把握认为x与Y之间具有线性相关关系.如果|r|≤r0.05,没有理由拒绝原来的假设.95%不具有1.判断(正确的打“√”,错误的打“×”)(1)求回归直线方程前必须进行相关性检验.()(2)两个变量的相关系数越大,它们的相关程度越强.()(3)若相关系数r=0,则两变量x,y之间没有关系.()[解析](1)正确.相关性检验是了解成对数据的变化规律的,所以求回归方程前必须进行相关性检验.(2)错误.相关系数|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.(3)错误.若r=0是指x,y之间的相关关系弱,但并不能说没有关系.[答案](1)√(2)×(3)×2.下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①②B.①②③C.①②④D.①②③④[解析]函数关系和相关关系的区别为前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方常用法,故③错误,④正确.[答案]C3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y^=0.85x-85.71,则下列结论中正确的是________(填序号).(1)y与x具有正的线性相关关系;(2)回归直线过样本点的中心(x,y);(3)若该大学某女生身高增加1cm,则其体重约增加0.85kg;(4)若该大学某女生身高为170cm,则可断定其体重必为58.79kg.[解析]回归方程中x的系数为0.850,因此y与x具有正的线性相关关系,(1)正确;由回归方程系数的意义可知回归直线过样本点的中心(x,y),(2)正确;依据回归方程中b^的含义可知,x每变化1个单位,y^相应变化约0.85个单位,(3)正确;用回归方程对总体进行估计不能得到肯定结论,故(4)不正确.[答案](1)(2)(3)合作探究提素养回归分析的有关概念【例1】(1)有下列说法:①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程y^=bx+a,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确命题的个数是()A.1B.2C.3D.4(2)如果某地的财政收入x与支出y满足线性回归方程y^=bx+a+ε(单位:亿元),其中b^=0.8,a^=2,|ε|≤0.5,如果今年该地区财政收入10亿元,则今年支出预计不会超过________亿.[解](1)①反映的是最小二乘法思想,故正确.②反映的是画散点图的作用,故正确.③解释的是回归方程y^=bx+a的作用,故正确.④是不正确的,在求回归方程之前必须进行相关性检验,以发现两变量的关系.(2)由题意可得:y^=0.8x+2+ε,当x=10时,y^=0.8×10+2+ε=10+ε,又|ε|≤0.5,∴9.5≤y^≤10.5.故今年支出预计不会超过10.5亿.[答案](1)C(2)10.51.在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程.2.由线性回归方程给出的是一个预报值而非精确值.3.随机误差的主要来源.(1)线性回归模型与真实情况引起的误差;(2)省略了一些因素的影响产生的误差;(3)观测与计算产生的误差.1.下列有关线性回归的说法,不正确的是________(填序号).①自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中用描点的方法得到表示具有相关关系的两个量的一组数据的图形叫做散点图;③线性回归方程最能代表观测值x,y之间的关系;④任何一组观测值都能得到具有代表意义的回归直线方程.[解析]只有具有线性相关的两个观测值才能得到具有代表意义的回归直线方程.[答案]④线性回归分析【例2】为研究拉力x(N)对弹簧长度y(cm)的影响,对不同拉力的6根弹簧进行测量,测得如下表中的数据:x51015202530y7.258.128.959.910.911.8(1)画出散点图;(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的回归直线方程.[思路探究]作散点图→得到x,y有较好线性关系→代入公式求得线性回归方程[解](1)散点图如图所示.(2)将已知表中的数据列成下表:xi51015202530yi7.258.128.959.910.911.8xiyi36.2581.2134.25198272.5354x2i25100225400625900x=17.5,y≈9.49,i=16xiyi=1076.2,i=16x2i=2275.∴b^=∑xiyi-6x-y-∑x2i-6x-2=1076.2-6×17.5×9.492275-6×17.52≈0.18,a^=y-b^x=9.49-0.18×17.5=6.34.∴回归直线方程为y^=0.18x+6.34.本题条件不变,若x增加2个单位,y^增加多少?[解]若x增加2个单位,则y^=0.18(x+2)+6.34=0.18x+6.34+0.36,故y^增加0.36个单位.1.散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.2.求回归直线方程时,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.非线性回归分析[探究问题]1.已知x和y之间的一组数据,则下列四个函数中,哪一个作为回归模型最好?x123y35.9912.01①y=3×2x-1;②y=log2x;③y=4x;④y=x2.[提示]观察散点图中样本点的分布规律可判断样本点分布在曲线y=3×2x-1附近.①作为回归模型最好.2.如何解答非线性回归问题?[提示]非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:【例3】某地区不同身高的未成年男性的体重平均值如下表:身高x(cm)60708090100110体重y(kg)6.137.909.9912.1515.0217.50身高x(cm)120130140150160170体重y(kg)20.9226.8631.1138.8547.2555.05(1)试建立y与x之间的回归方程;(2)如果一名在校男生身高为168cm,预测他的体重约为多少?[思路探究]先由散点图确定相应的函数模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.[解](1)根据表中的数据画出散点图,如下:由图看出,这些点分布在某条指数型函数曲线y=c1ec2x的周围,于是令z=lny,列表如下:x60708090100110z1.812.072.302.502.712.86x120130140150160170z3.043.293.443.663.864.01作出散点图,如下:由表中数据可求得z与x之间的回归直线方程为z^=0.693+0.020x,则有y^=e0.693+0.020x.(2)由(1)知,当x=168时,y^=e0.693+0.020×168≈57.57,所以在校男生身高为168cm,预测他的体重约为57.57kg.两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y=c1ec2x,我们可以通过对数变换把指数关系变为线性关系,令z=lny,则变换后样本点应该分布在直线z=bx+aa=lnc1,b=c2的周围.2.有一个测量水流量的实验装置,测得试验数据如下表:i1234567水深h(厘米)0.71.12.54.98.110.213.5流量Q(升/分钟)0.0820.251.811.237.566.5134根据表中数据,建立Q与h之间的回归方程.[解]由表中测得的数据可以作出散点图,如图.观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近,表示该曲线的函数模型是Q=m·hn(m,n是正的常数).两边取常用对数,则lgQ=lgm+n·lgh,令y=lgQ,x=lgh,那么y=nx+lgm,即为线性函数模型y=bx+a的形式(其中b=n,a=lgm).由下面的数据表,用最小二乘法可求得b^≈2.5097,a^=-0.7077,所以n≈2.51,m≈0.196.ihiQixi=lghiyi=lgQix2ixiyi10.70.082-0.1549-1.08620.0240.168321.10.250.0414-0.60210.0017-0.024932.51.80.39790.25530.15830.101644.911.20.69021.04920.47640.724258.137.50.90851.57400.82541.4300610.266.51.00861.82281.01731.8385713.51341.13032.12711.27762.4043∑4.0225.14013.78076.642于是所求得的回归方程为Q=0.196·h2.51.当堂达标固双基1.下表是x和y之间的一组数据,则y关于x的线性回归方程必过点()x1234y1357A.(2,3)B.(1.5,4)C.(2.5,4)D.(2.5,5)[解析]线性回归方程必过样本点的中心(x,y),即(2.5,4),故选C.[答案]C2.在两个变量y与x的回归模型中,分别选择了4个不同的模型.它们的相关指数R2如下,其中拟合效果最好的模型是()A.模型1的相关指数R2为0.98B.模型2的相关指数R2为0.80C.模型3的相关指数R2为0.50D.模型4的相关指数R2为0.25[解析]相关指数R2越接近于1,则该模型的拟合效果就越好,精度越高.[答案]A3.如图所示,有5组(x,y)数据,去掉________这组数据后,剩下的4组数据的线性相关系数最大.[答案]D(3,10)4.为了考查两个变量Y与x的线性相关性,测是x,Y的13对数据,若Y与x具有线性相关关系,则相关系数r绝对值的取值范围是________.[解析]相关系数临界值r0.05=0.553,所以Y与x若具有线性相关关系,则相关系数r绝对值的范围是(0.553,1].[答案](0.553
本文标题:2019-2020学年高中数学 第1章 统计案例 1.2 回归分析课件 新人教B版选修1-2
链接地址:https://www.777doc.com/doc-8291950 .html