您好,欢迎访问三七文档
第2章统计2.4线性回归方程学习目标核心素养1.了解两个变量之间的相关关系并与函数关系比较.2.会作散点图,并利用散点图判断两个变量之间是否具有线性相关关系.3.能根据给出的线性回归方程系数公式建立线性回归方程,并能由回归方程对总体进行预测、估计.(重点、难点)通过对已有数量的分析、运算培养学生数据分析、数学运算的核心素养.自主预习探新知1.变量之间的两类常见关系在实际问题中,变量之间的常见关系有如下两类:一类是___________关系,变量之间的关系可以用函数表示.另一类是_____关系,变量之间有一定的联系,但不能完全用函数表示.2.相关关系的分类相关关系分______相关和_______相关两种.确定性函数相关线性非线性3.线性回归方程系数公式能用直线方程y^=bx+a近似表示的相关关系叫做线性相关关系,该方程叫_______________.给出一组数据(x1,y1),(x2,y2),…,(xn,yn),线性回归方程中的系数a,b满足b=ni=1nxiyi-i=1nxii=1nyini=1nx2i-i=1nxi2,a=y-bx.线性回归方程上式还可以表示为b=i=1nxiyi-nx-y-i=1nx2i-nx2=i=1nxi-xyi-yi=1nxi-x2,a=y-bx.①③④[②⑤为确定关系不是相关关系.]1.有下列关系:①人的年龄与其拥有的财富之间的关系;②曲线上点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其横截面直径与高度之间的关系;⑤学生与其学号之间的关系.其中具有相关关系的是________.③[散点图①中的点无规律的分布,范围很广,表明两个变量之间的相关程度很小;②中所有的点都在同一条直线上,是函数关系;③中点的分布在一条带状区域上,即点分布在一条直线的附近,是线性相关关系;④中的点也分布在一条带状区域内,但不是线性的,而是一条曲线附近,所以不是线性相关关系,故填③.]2.下面四个散点图中点的分布状态,直观上判断两个变量之间具有线性相关关系的是________.②[回归直线斜率为80,所以x每增加1,y^增加80,即劳动生产率提高1000元时,工资提高80元.]3.工人工资y(元)依劳动生产率x(千元)变化的线性回归方程为y^=50+80x,下列判断正确的是________.①劳动生产率为1000元时,工资为130元;②劳动生产率提高1000元时,工资提高80元;③劳动生产率提高1000元时,工资提高130元;④当月工资为250元时,劳动生产率为2000元.4.下表是广告费用与销售额之间的一组数据:广告费用(千元)1461014销售额(千元)1944405253销售额y(千元)与广告费用x(千元)之间有线性相关关系,回归方程为y^=2.3x+a(a为常数),现要使销售额达到6万元,估计广告费用约为________千元.15[x=7,y=41.6,则a=y-2.3x=41.6-2.3×7=25.5.当y=6万元=60千元时,60=2.3x+25.5,解得x=15(千元).]合作探究提素养变量间相关关系的判断【例1】在下列两个变量的关系中,具有相关关系的是________.①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故发生率之间的关系.②④[两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系.]1.函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.准确理解变量间的相关关系是解答本题的关键.要准确区分两个变量间的相关关系和函数关系,事实上,现实生活中相关关系是处处存在的,从某种意义上讲,函数关系可以看作一种理想的关系模型,而相关关系是一种普遍的关系.两者区别的关键点是“确定性”还是“不确定性”.1.下列两个变量中具有相关关系的是________(填写相应的序号).①正方体的棱长和体积;②单产为常数时,土地面积和总产量;③日照时间与水稻的亩产量.③[正方体的棱长x和体积V存在着函数关系V=x3;单产为常数a公斤/亩,土地面积x(亩)和总产量y(公斤)之间也存在着函数关系y=ax.日照时间长,则水稻的亩产量高,这只是相关关系,应选③.]2.下列命题:①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.其中正确的命题为________.③④⑤[两个变量不一定是相关关系,也可能是确定性关系,故①错误;圆的周长与该圆的半径具有函数关系,故②错误;③④⑤都正确.]散点图的画法及应用【例2】现有5个同学的数学和物理成绩如下表:学生学科ABCDE数学8075706560物理7066686462利用散点图判断它们是否具有线性相关关系?如果有线性相关关系,是正相关还是负相关?思路点拨:本题涉及两个变量(数学成绩与物理成绩),以x轴表示数学成绩、y轴表示物理成绩,可得相应的散点图,再观察散点图得出结论.[解]把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在平面直角坐标系中描点(xi,yi)(i=1,2,…,5).从图中可以直观地看出数学成绩和物理成绩具有线性相关关系,且当数学成绩减小时,物理成绩也由大变小,即它们正相关.1.判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.如果变量的对应点分布没有规律,我们就可以认为这两个变量不具有相关关系.2.正相关、负相关线性相关关系又分为正相关和负相关.正相关是指两个变量具有相同的变化趋势,即从整体上来看,一个变量会随另一个变量变大而变大.从散点图上看,因变量随自变量的增大而增大,图中的点分布在左下角到右上角的区域.负相关是指两个变量具有相反的变化趋势,即从整体上来看,一个变量会随另一个变量变大而变小.从散点图上看,因变量随自变量的增大而减小,图中的点分布在左上角到右下角的区域.提醒:画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.3.如图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系?思路点拨:观察图中点的分布情况作出判断.从散点图上看,点的分布散乱无规律,故不具有相关关系.[解]不具有相关关系,因为散点散乱地分布在坐标平面内,不呈线形.4.有个男孩的年龄与身高的统计数据如下:年龄(岁)123456身高(cm)788798108115120画出散点图,并判断它们是否有相关关系?如果有相关关系,是正相关还是负相关?思路点拨:描点(1,78),(2,87),(3,98),(4,108),(5,115),(6,120).观察点的分布,作出判断.[解]作出散点图如图:由图可见,具有线性相关关系,且是正相关.线性回归方程的求法及应用【例3】某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据.广告支出x/万元1234销售收入y/万元12284256(1)画出表中数据的散点图;(2)求出y对x的回归直线方程y^=bx+a,并解释b的意义;(3)若广告费为9万元,则销售收入约为多少万元?思路点拨:画散点图→列表处理数据→计算x,y,ni=14x2i,i=14xiyi→计算b→计算a→线性回归方程→销售收入[解](1)散点图如图.(2)观察散点图可知各点大致分布在一条直线附近,列出下列表格,以便计算回归系数a,B.序号xyx2y2xy111211441222284784563342917641264456163136224∑10138305828418于是x=52,y=692,i=14x2i=30,i=14y2i=5828,i=14xiyi=418,代入公式得,b=i=14xiyi-4xyi=14x2i-4x2=418-4×52×69230-4×522=735,a=y-bx=692-735×52=-2.故y对x的回归直线方程为y^=735x-2,其中回归系数b=735,它的意义是:广告支出每增加1万元,销售收入y平均增加735万元.(3)当x=9万元时,y^=735×9-2=129.4(万元),即若广告费为9万元,则销售收入约为129.4万元.1.求样本数据的线性回归方程,可按下列步骤进行:第一步,计算平均数x,y;第二步,求和i=1nxiyi,i=1nx2i;第三步,计算b=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nxyi=1nx2i-nx2,a=y-bx;第四步,写出线性回归方程y^=bx+A.2.对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.提醒:(1)对一组数据进行线性回归分析时,应先画出其散点图,判断变量之间是否线性相关,再由系数a,b的计算公式,计算出a,b,由于计算量较大,在计算时应借助计算器,仔细计算,以防出现错误.(2)为了方便,常制表对应算出xiyi,x2i,以便于求和.(3)研究变量间的相关关系,求得回归直线方程能帮助我们发现事物发展的一些规律,估计、预测某些数据,为我们的判断和决策提供依据.5.如图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1-7分别对应年份2012-2018.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2018年我国生活垃圾无害化处理量.参考数据:∑7i=1yi=9.32,∑7i=1tiyi=40.17,∑7i=1yi-y2=0.55,7≈2.646.参考公式:相关系数r=∑ni=1ti-tyi-y∑ni=1ti-t2∑ni=1yi-y2,回归方程y^=a+bt中斜率和截距的最小二乘估计公式分别为b=∑ni=1ti-tyi-y∑ni=1ti-t2,a=y--bt.思路点拨:(1)利用相关系数的大小――→确定y与t的线性相关程度(2)求出回归方程→利用方程进行估计[解](1)由折线图中的数据和附注中的参考数据得t=4,∑7i=1(ti-t)2=28,∑7i=1yi-y2=0.55,∑7i=1(ti-t)(yi-y)=∑7i=1tiyi-t∑7i=1yi=40.17-4×9.32=2.89,∴r≈2.890.55×2×2.646≈0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当大,从而可以用线性回归模型拟合y与t的关系.(2)由y=9.327≈1.331及(1)得b=∑7i=1ti-tyi-y∑7i=1ti-t2=2.8928≈0.103.a=y-bt≈1.331-0.103×4≈0.92.所以y关于t的回归方程为y^=0.92+0.10t.将2016年对应的t=9代入回归方程得y^=0.92+0.10×9=1.82.所以预测2020年我国生活垃圾无害化处理量约为1.82亿吨.1
本文标题:2019-2020学年高中数学 第2章 统计 2.4 线性回归方程课件 苏教版必修3
链接地址:https://www.777doc.com/doc-8290720 .html