您好,欢迎访问三七文档
统计第二章2.3变量间的相关关系2.3.1变量之间的相关关系2.3.2两个变量的线性相关课前自主预习1.理解两个变量的相关关系的概念.2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.3.会求线性回归方程.1.变量之间常见的关系函数关系变量之间的关系可以用函数表示相关关系变量之间有一定的联系,但不能完全用函数表示2.相关关系与函数关系的区别与联系3.散点图将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.4.正相关与负相关(1)正相关:散点图中的点散布在从到的区域.(2)负相关:散点图中的点散布在从到的区域.5.回归直线与回归方程如果散点图中点的分布从整体上看大致在附近,就称这两个变量之间具有关系,这条直线叫做回归直线.对应的方程叫做回归直线的方程,简称回归方程.6.最小二乘法求回归直线方程y^=b^x+a^时,使得样本数据的点到回归直线的最小的方法叫做最小二乘法.左下角右上角左上角右下角一条直线线性相关回归直线距离的平方和7.用最小二乘法求回归方程中的a^,b^有下面的公式b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nx-y-i=1nx2i-nx2,a^=y-b^x,其中x=1ni=1nxi,y=1ni=1nyi.这样,回归方程的斜率为b^,纵截距为a^,即回归方程为y^=b^x+a^.判断正误.(正确的打“√”,错误的打“×”)(1)已知变量x的值,可由回归方程y^=b^x+a^得到变量y的精确值.()(2)回归方程y^=b^x+a^必经过点(x-,y-).()(3)由一组数据(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方程y^=b^x+a^至少经过(x1,y1),(x2,y2),…,(xn,yn)中的一个点.()(4)选取一组数据中的部分点得到的回归方程与由整组数据得到的回归方程是同一个方程.()[提示](1)×(2)√(3)×(4)×课堂互动探究题型一相关关系的判定【典例1】(1)下列变量之间的关系不是相关关系的是()A.二次函数y=ax2+bx+c中,a,c是已知常数,取b为自变量,因变量是判别式Δ=b2-4acB.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩田施肥量和粮食亩产量(2)以下是在某地搜集到的不同楼盘房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:房屋面积x/m211511080135105销售价格y/万元49.643.238.858.444①画出数据对应的散点图;②判断房屋的销售价格和房屋面积之间是否具有相关关系,如果有相关关系,是正相关还是负相关?[解析](1)在A中,若b确定,则a,b,c都是常数,Δ=b2-4ac也就唯一确定了,因此,这两者之间是确定性的函数关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所以B,C,D是相关关系.故选A.(2)①数据对应的散点图如图所示.②通过以上数据对应的散点图可以判断,房屋的销售价格和房屋面积之间具有相关关系,并且是正相关.[答案](1)A(2)见解析判断两个变量的相关性的常用方法(1)散点图法:通过画散点图,观察图中点的分布特征,直观给出判断.(2)表格、关系式法:通过表格或关系式直接进行判断.[针对训练1]在下列两个变量的关系中,判断是否具有相关关系?①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③人的身高与年龄之间的关系;[解]两变量之间的关系有三种:函数关系、相关关系和不相关.①正方形的边长与面积之间的关系是函数关系.②作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.题型二求回归直线方程【典例2】某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070(1)画出散点图;(2)求回归方程.[解](1)散点图如图所示.(2)列出下表,并用科学计算器进行有关计算.I12345xi24568yi3040605070xiyi60160300300560x2i416253664x=5,y=50,i=15x2i=145,i=15xiyi=1380于是可得,b^=i=15xiyi-5xyi=15x2i-5x2=1380-5×5×50145-5×52=6.5,a^=y-b^x=50-6.5×5=17.5.于是所求的回归方程是y^=6.5x+17.5.引申探究1:若典例2的条件不变,利用例2中所求得的回归方程,计算若广告费支出增加一个单位,销售额增加多少?[解]由回归方程y^=6.5x+17.5可知,当x增加一个单位时,y大约增加6.5.引申探究2:若典例2的条件不变,要使销售额提升到100(单位:百万元),则广告费至少要支出多少?[解]由6.5x+17.5=100,解得x=12.7,即广告费至少要支出12.7(单位:百万元).(1)求线性回归方程的步骤第一步,计算平均数x,y;第二步,求和i=1nxiyi,i=1nx2i;第三步,计算b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nx-y-i=1nx2i-nx-2,a^=y-b^x;第四步,写出回归直线方程y^=b^x+a^.(2)求线性回归方程的注意事项①利用散点图判定两个变量是否具有线性相关关系,注意不要受个别点的位置的影响.②求回归方程,关键在于正确求出系数a^,b^,由于a^,b^的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生的错误.[针对训练2]已知变量x,y有如下对应数据:x1234y1345(1)作出散点图;(2)用最小二乘法求关于x,y的回归直线方程.[解](1)散点图如图所示:(2)x-=1+2+3+44=52,y-=1+3+4+54=134,i=14xiyi=1+6+12+20=39.i=14x2i=1+4+9+16=30,b^=39-4×52×13430-4×522=1310,a^=134-1310×52=0,所以y^=1310x为所求的回归直线方程.题型三利用回归方程对总体进行估计【典例3】某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20082010201220142016需求量/万吨236246257276286(1)利用所给数据求年需求量与年份之间的回归直线方程y^=b^x+a^;(2)利用(1)中所求出的直线方程预测该地2020年的粮食需求量.[解](1)由所给数据看出,年需求量与年份之间是近似直线上升的.对数据预处理如下:年份-2012-4-2024需求量-257-21-1101929对预处理后的数据,容易算得x=0,y=3.2,b^=-4×-21+-2×-11+2×19+4×29-42+-22+22+42=26040=6.5.a^=y-b^x=3.2.由上述计算结果,知所求回归直线方程为y^-257=b^(x-2012)+a^=6.5(x-2012)+3.2.即y^=6.5(x-2012)+260.2.①(2)利用直线方程①,可预测2020年的粮食需求量为6.5×(2020-2012)+260.2=6.5×8+260.2=312.2(万吨).用线性回归方程估计总体的一般步骤(1)作出散点图,判断散点是否在一条直线附近.(2)如果散点在一条直线附近,用公式求出a^,b^,并写出线性回归方程.(3)根据线性回归方程对总体进行估计.[针对训练3]下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y^=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y^=99+17.5t.(1)分别利用这两个模型,求该地区2020年的环境基础设施投资额的预测值.(2)你认为用哪个模型得到的预测值更可靠?并说明理由.[解](1)利用模型①,可得该地区2020年的环境基础设施投资额的预测值为y^=-30.4+13.5×21=313.9(亿元).利用模型②,可得该地区2020年的环境基础设施投资额的预测值为y^=99+17.5×11=291.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y^=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.课堂归纳小结1.判断变量之间有无相关关系,简便可行的方法就是绘制散点图.根据散点图,可看出两个变量是否具有相关关系,是否线性相关,是正相关还是负相关.2.求回归直线的方程时应注意的问题(1)知道x与y呈线性相关关系,无需进行相关性检验,否则应首先进行相关性检验.如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算a^,b^的值时,要先算出b^,然后才能算出a^.3.利用回归方程,我们可以进行估计和预测.若回归方程为y^=b^x+a^,则x=x0处的估计值为y^0=b^x0+a^.
本文标题:2019-2020学年高中数学 第2章 统计 2-3 变量间的相关关系课件 新人教A版必修3
链接地址:https://www.777doc.com/doc-8290700 .html