您好,欢迎访问三七文档
第二章统计2.3变量间的相关关系2.3.1变量之间的相关关系2.3.2两个变量的线性相关[学习目标]1.理解变量间的相关关系(重点).2.会画散点图,能利用散点图判断两个变量是否具有相关关系(重点).3.了解线性回归思想,会求回归直线方程(难点).[知识提炼·梳理]1.变量间的相关关系(1)相关关系:不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.(2)散点图:将样本中几个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到的图形.(3)正相关与负相关.①正相关:散点图中的点散布在从左下角到右上角的区域.②负相关:散点图中的点散布在从左上角到右下角的区域.2.回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫作回归直线.(2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程.(3)最小二乘法:求回归直线时,使得样本数据的点到回归直线的距离的平方和最小的方法叫作最小二乘法.(4)求回归方程:若两个具有线性相关关系的变量的一组数据为:(x1,y1),(x2,y2),…,(xn,yn),则所求的回归方程为y^=b^x+a^,其中a^,b^为待定的参数,由最小二乘法得:b^是回归直线斜率,a^是回归直线在y轴上的截距.温馨提示:使得样本数据的点到它的距离的平方和最小,由于平方又叫二乘方,所以这种使“偏差平方和为最小”的方法,叫作最小二乘法.[思考尝试·夯基]1.思考判断(正确的打“√”,错误的打“×”).(1)线性回归方程必经过点(x-,y-).()(2)对于方程y^=b^x+a^,x增加一个单位时,y平均增加b^个单位.()(3)样本数据中x=0时,可能有y=a^.()(4)样本数据中x=0时,一定有y=a^.()解析:根据回归直线方程的意义知,(1)(2)都正确,而(3)(4)中,样本数据x=0时,y的值可能为a^,也可能不是a^,故(3)正确.答案:(1)√(2)√(3)√(4)×2.下列变量之间的关系是函数关系的是()A.已知二次函数y=ax2+bx+c,其中a,c是常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4acB.光照时间和果树产量C.降雪量与交通事故发生率D.每亩施肥量与粮食亩产量解析:容易看出B、C、D三项都是相关关系而A是一种确定的关系,是函数.答案:A3.设有一个回归方程为y^=-1.5x+2,则变量x增加一个单位时()A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位解析:因为两个变量线性负相关,所以变量x增加一个单位,y平均减少1.5个单位.答案:C4.有关线性回归的说法如下:①相关关系的两个变量不是因果关系;②散点图能直观地反映数据的相关程度;③回归直线最能代表线性相关的两个变量之间的关系;④任一组数据都有回归方程.其中说法正确的是________(填序号).解析:只有线性相关的数据才有回归直线.故①②③均正确,④不正确.答案:①②③5.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y^=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x+1代替x,得y^=0.254(x+1)+0.321,与y^=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.答案:0.254类型1相关关系的判断[典例1](1)下列关系中,属于相关关系的是______(填序号).①人的身高与视力的关系;②做自由落体运动的物体的质量与落地时间的关系;③降雪量与交通事故的发生率之间的关系.(2)有个男孩的年龄与身高的统计数据如下:年龄/岁123456身高/cm788798108115120画出散点图,并判断它们是否有相关关系.如果有相关关系,是正相关还是负相关?(1)解析:①身高与视力无关,不具有函数关系,也不具有相关关系;②自由落体的物体的质量与落地时间无关,不具有相关关系;③降雪量越大,交通事故发生率越高,具有不确定性的相关关系.答案:③(2)解:散点图是分析变量相关关系的重要工具.作出散点图如下图所示.由图可见,男孩年龄与身高具有线性相关关系,且是正相关.归纳升华1.两个变量x和y相关关系的确定方法:(1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断.(2)表格、关系式法:结合表格或关系式进行判断.(3)经验法:借助积累的经验进行分析判断.2.判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的.注意不要受个别点的位置的影响.[变式训练]以下是在某地搜集到的不同楼盘房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:房屋面积11511080135105销售价格49.643.238.858.444判断房屋的销售价格和房屋面积之间是否具有线性相关关系.如果有线性相关关系,是正相关还是负相关?解:数据对应的散点图如图:由以上数据对应的散点图可以判断,房屋的销售价格和房屋面积之间具有线性相关关系,是正相关.类型2求回归直线方程(规范解答)[典例2](本小题满分12分)某化工厂的原料中,有A和B两种有效成分,现随机抽取了10份原料样品进行抽样检测,测得A和B的含量如下表所示:成分12345678910A/%67547264392258434634B/%24152319161120161713设成分A的百分含量为x%,成分B的百分含量为y%.(1)作出两个变量y与x的散点图;(2)两个变量y与x是否线性相关?若是线性相关,求出线性回归方程.[审题指导]先画出散点图,确定相关关系,再求回归直线系数,写出回归直线方程.[规范解答](1)按照y从小到大的顺序调整表中数据,如下表所示:x22345443394664587267y11131516161719202324散点图如图所示:(4分)(2)观察散点图可知,y与x是线性相关关系.i12345678910合计xi22345443394664587267499yi11131516161719202324174xiyi24244281068862478212161160165616089228x2i48411562916184915212116409633645184448927175所以x-=49.9,y-=17.4,10x-y-=8682.6,10x-2=24900.1.设所求的线性回归方程是y^=b^x+a^,(7分)(10分)失分警示:若求错回归直线系数,扣3分所以所求的线性回归方程是y^=0.2397x+5.439.(12分)失分警示:若写错回归直线方程,扣2分归纳升华用公式求回归方程的一般步骤1.列表写出xi,yi,xiyi的值.2.计算x-,y-,xiyi.3.代入公式计算b^,a^的值.4.写出回归方程.[类题尝试]下表为某地近几年机动车辆数与交通事故数的统计资料.机动车辆数x/千台95110112120129135150180交通事故数y/千件6.27.57.78.58.79.810.213(1)请判断机动车辆数与交通事故数之间是否具有线性相关关系,如果不具有线性相关关系,说明理由;(2)如果具有线性相关关系,求出回归方程.解:(1)在平面直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系.(2)计算相应的数据之和:x-=128.875,y-=8.95.将它们代入公式计算得b^≈0.0774,a^≈-1.0249,所以,所求回归方程为y^=0.0774x-1.0249.类型3线性回归方程的应用[典例3]下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几组对照数据:x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤.解:(1)散点图如图所示(2)由题意,得i=14xiyi=3×2.5+4×3+5×4+6×4.5=66.5,x-=3+4+5+64=4.5,y-=2.5+3+4+4.54=3.5,i=14x2i=32+42+52+62=86,则b^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a^=y--b^x-=3.5-0.7×4.5=0.35,故线性回归方程为y^=0.7x+0.35.(3)根据线性回归方程的预测,现在生产100吨甲产品消耗的标准煤的数量为0.7×100+0.35=70.35,故消耗能源减少了90-70.35=19.65吨标准煤.归纳升华回归分析的步骤1.进行相关性检验,若两变量无线性相关关系,则所求的线性回归方程毫无意义.2.求回归直线方程,其关键是正确地求得a^,b^的值.3.根据直线方程进行预测.[变式训练]一台机器由于使用时间较长(但还可以使用),它按不同的转速生产出来的某机器零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表是抽样试验的结果:转速x/(转/秒)(x∈N*)1614128每小时生产有缺点的零件数y/件11985(1)若y与x具有线性相关关系,求回归方程;(2)若实际生产中,允许每小时的产品中有缺点的零件数最多为10件,则机器的转速应该控制在什么范围内?解:(1)由题意,可得x-=12.5,y-=8.25,i=14xiyi=438,i=14x2i=660,则b^=438-4×12.5×8.25660-4×12.52≈0.7286,a^=y--b^x-≈-0.8575.故回归直线的方程为y^=0.7286x-0.8575.(2)要使y≤10,则0.7286x-0.8575≤10,解得x≤14.90.故机器的转速应该控制在15转/秒以下.1.两个变量之间的关系与其对应的散点图特征.(1)两个变量间的关系是函数关系时,数据点位于某曲线上.(2)两个变量间的关系是相关关系时,数据点位于某曲线附近.(3)两个变量间的关系是线性相关时,数据点位于某直线附近.2.求回归直线方程时应注意的问题.(1)知道x与y呈线性相关关系,无须进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算a^,b^的值时,要先算出b^,然后才能算出a^.3.利用回归方程,我们可以进行估计和预测.若回归直线方程为y^=b^x+a^,则在x=x0处的估计值为y^0=b^x0+a^.
本文标题:2019秋高中数学 第二章 统计 2.3 变量间的相关关系课件 新人教A版必修3
链接地址:https://www.777doc.com/doc-8246497 .html