您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 绩效管理 > 2.3.1变量之间的相关关系课件
2.3变量间的相关关系2.3.1变量之间的相关关系2.3.2两个变量的线性相关城门失火殃及池鱼世界是一个普遍联系的整体,任何事物都与其他事物相联系.函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系.在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?不是函数关系,但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如果能通过数学成绩对物理成绩进行合理估计,将有着非常重要的现实意义.1.理解两个变量的相关关系的概念.(重点)2.会作散点图,并利用散点图判断线性相关关系.(难点)3.了解最小二乘法的思想及回归方程系数公式的推导过程.4.通过实例加强回归直线方程含义的理解,能够对实际问题进行分析和预测.当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.例:(1)商品销售收入与广告支出经费之间的关系;(2)粮食产量与施肥量之间的关系;(3)人体内脂肪含量与年龄之间的关系.变量之间的相关关系相关关系是一种非确定关系【课堂探究1】不同点:1.函数关系是一种确定的关系,是两个非随机变量之间的关系;而相关关系是一种非确定关系,是非随机变量与随机变量之间的关系.2.两个变量之间产生相关关系的原因是受许多不确定的随机因素的影响.3.需要通过样本来判断变量之间是否存在相关关系.相关关系与函数关系的异同点:相同点:均是指两个变量的关系.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?年龄23273941454950脂肪9.517.821.225.927.526.328.2年龄53545657586061脂肪29.630.231.430.833.535.234.6在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域.例1以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关.房屋面积(平方米)617011511080135105销售价格(万元)12.215.324.821.618.429.222售价/万元正相关解:在下列两个变量的关系中,哪些是相关关系?①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.答案:②③④【变式练习】【总结提升】在研究两个变量之间是否存在某种关系时,必须从散点图入手,对于散点图,可以作如下判断:(1)如果所有的样本点都落在某一函数曲线上,变量之间就是函数关系;(2)如果所有的样本点都落在某一函数曲线的附近,变量之间就有相关关系;(3)如果所有的样本点都落在某一直线的附近,变量之间就有线性相关关系;(4)如果散点图中的点的分布几乎没有什么规则,则这两个变量之间不具有相关关系,即两个变量之间是相互独立的.除了散点图,还有其他的表示相关关系的图形吗?年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?这些点大致分布在一条直线附近.回归直线【课堂探究2】我们再观察它的图象发现这些点大致分布在一条直线附近,像这样,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,该直线所对应的方程叫做回归方程.那么,我们该怎样求出这个回归方程呢?请同学们展开讨论,能得出哪些具体的方案?方案1.先画出一条直线,测量出各点与它的距离,再移动直线,到达一个使距离的和最小的位置时,测出它的斜率和截距,得到回归方程.如图:方案2.在图中选两点作直线,使直线两侧的点的个数基本相同.方案3.如果多取几组点,确定多条直线,再求出这些直线的斜率和截距的平均数作为回归直线的斜率和截距而得到回归方程.如图:对一组具有线性相关关系的样本数据:(x1,y1),(x2,y2),…,(xn,yn),如何求回归方程?ˆˆˆybxa最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.1211221()()ˆ()ˆˆniiiniiniiiniixxyybxxxynxyxnxaybxˆˆˆybxa例2有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:/℃130128132150156热饮杯数12740-5摄氏温度13012813215015612740-55476938910411636312723191554769389104116363127231915(1)画出散点图.(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律.(3)求回归方程.(4)如果某天的气温是2℃,预测这天卖出的热饮杯数.解:(1)散点图如下:热饮杯数温度/℃O102030405060160150140130120110100908070-10·········(2)从散点图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此利用公式求出回归方程的系数.得回归方程.=-2.352x+147.767(4)当x=2时,=143.063.因此,某天的气温为2℃时,这天大约可以卖出143杯热饮.yy求样本数据的线性回归方程,可按下列步骤进行:第一步,计算平均数,;第二步,求和,;第三步,计算第四步,写出回归方程.xy1niiixy21niix1122211()()ˆˆˆ,;()nniiiiiinniiiixxyyxynxybaybxxxxnx【总结提升】1.下面哪些变量是相关关系()A.出租车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D.铁的大小与质量C2.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是()yA.y与x具有正的线性相关关系B.回归直线过样本点的中心C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg解:选D.本题考查线性回归方程的特征与性质,意在考查考生对线性回归方程的了解,解题思路:A,B,C均正确,是回归方程的性质,D项是错误的,线性回归方程只能预测学生的体重.选项D应改为“若该大学某女生身高为170cm,则估计其体重大约为58.79kg”.[易错点]本题易错一:对线性回归方程不了解,无法得出答案;易错二:对回归系数b不了解,错选C;易错三:线性回归方程有预测的作用,得出的结果不是准确结果,误以为D项是对的.3.(2014·重庆高考)已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的回归方程可能是()A.y=0.4x+2.3B.y=2x-2.4C.y=-2x+9.5D.y=-0.3x+4.4【解析】选A.由正相关可知斜率为正,故可排除C,D两项,又因为y=0.4x+2.3经过点(3,3.5).4.已知x,y的取值如下表所示:如果y与x线性相关,且线性回归方程为,则=()A.B.C.D.解:因为又,7ˆˆybx2ˆb1212110110234546x3,y5,337ˆa271ˆˆ53b,b.22所以所以B5.为分析初中升学考试的数学成绩对高一学生学习情况的影响,在高一年级学生中随机抽取了10名学生,他们的入学成绩与期末考试成绩如下表:学生编号12345678910入学成绩x63674588817152995876期末成绩y65785282928973985675(1)若变量之间具有线性相关关系,求出回归直线的方程.(2)若某学生的入学成绩为80分,试估计他的期末成绩.【解析】(1)1(63674588817152995876)7010x,1(65785282928973985675)76,10y1221ˆ0.76556,niiiniixynxybxnx所以ˆˆ22.4108,aybx故所求线性回归直线方程是22.41080.76556yx.(2)某学生入学成绩为80分,代入上式可求得84y,即这个学生期末成绩的预测分值约为84分.变量间的关系函数关系相关关系散点图线性相关确定关系线性回归方程不确定关系追赶时间的人,生活就会宠爱他;放弃时间的人,生活就会冷落他.
本文标题:2.3.1变量之间的相关关系课件
链接地址:https://www.777doc.com/doc-1334192 .html