您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 2.3变量间的相关关系(2011.3.8第四周星期二)
2.3变量间的相关关系2.3.1变量之间的相关关系在学校,老师经常对学生这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题。”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种关系。我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间是一种怎样的关系?是我们以前学的函数关系吗?思考?我们不能通过一个人的数学成绩是多少就准确地断定其物理成绩能达到多少,因为学习兴趣、学习时间、教学水平等,也是影响物理成绩的一些因素,所以它们之间不是确定的函数关系,只能说它们之间是一种不确定性的关系,而这种关系生活中是大量存在的.函数关系——是一种确定的因果关系,即自变量取值给定时,因变量的值是唯一确定的1〉商品销售收入与广告支出经费之间的关系。商品销售收入与广告支出经费之间有着密切的联系,但商品收入不仅与广告支出多少有关,还受商品质量、居民收入等因素的影响,不是由广告支出经费完全确定的。例如:在一定范围内,施肥量越大,粮食产量可能就越高。但是,施肥量并不是决定粮食产量的唯一因素,因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响。2〉粮食产量与施肥量之间的关系。这种不确定的关系叫什么?3〉同桌同学的数学成绩之间的关系。如果某次考试其中一位同学的数学成绩为90分,你能确定另一位同学的数学成绩为多少吗?自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.一、两个变量间的相关关系:相同点:两者均是指两个变量间的关系.不同点:①函数关系是非随机变量间的一种确定的因果关系,在坐标系中,两个变量的函数关系可以表示成一条直线或曲线;②而相关关系是随机变量间的一种非确定的关系,不一定是因果关系,可能是一种伴随关系.相关关系与函数关系的异同点:练习:现实生活中存在许多相关关系,在下列两个变量的关系中,哪些是相关关系?①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③人的身高与体重之间的关系;④人的身高与视力之间的关系;⑤商品销售收入与广告支出经费之间的关系;⑥粮食产量与施肥量之间的关系;⑦匀速行驶的车辆的行驶距离与时间×××通过收集两个变量的大量数据,进行统计和数据分析,找出其中的规律,对其相关关系的程度作出一定判断.由于变量之间相关关系的广泛性和不确定性,所以样本数据应较大,和有代表性.才能对它们之间的关系作出正确的判断.如何判断两个变量之间是否具有相关关系以及相关程度的强弱年龄脂肪239.52717.83921.24125.9454927.526.35028.25329.65430.25631.45730.8年龄脂肪5833.56035.26134.6根据以上数据,你能分析出人体的脂肪含量与年龄之间具有怎样的相关关系?这种相关关系有多强?探究人体内的脂肪含量与饮食习惯、体育锻炼等诸多因素有关。调查发现在一定年龄段内,随着年龄的增长,人体内的脂肪含量也会增加,如下表所示在坐标系中作图:以年龄xi为横坐标,脂肪含量yi为纵坐标,将各数据在平面坐标系中的对应点(xi,yi)画出来,得到如下图形:O20253035404550556065年龄脂肪含量510152025303540年龄脂肪239.52717.83921.24125.9454927.526.35028.25329.65430.25631.45730.8年龄脂肪5833.56035.26134.6将两个变量的样本数据在平面坐标系中的对应点(xi,yi)画出来,得到一些孤立分散的点,这样的图形叫做散点图。O20253035404550556065年龄脂肪含量510152025303540上述散点图中看出,散点分布在从左下角到右上角的区域,呈上升趋势,表明脂肪含量随年龄增加大体上也是增加的,把这种相关称为正相关如右图是汽车的载重和汽车每消耗1升汽油所行使的平均路程的散点图。发现,散点散布在从左上角到右下角的区域内,呈下降趋势,则称它们成负相关.O如高原含氧量与海拔高度的相关关系,海平面以上,海拔高度越高,含氧量越少。由散点图发现:所有的样本点都落在某一直线附近,我们称这两个变量之间的相关关系为线性相关关系,并称这条直线为回归直线,回归直线的方程称为回归方程O20253035404550556065年龄脂肪含量510152025303540散点图中的所有点会不会全部落在一条直线上呢?为什么?O20253035404550556065年龄脂肪含量510152025303540画出散点图,并判断它们是否具有下列相关关系如果散点分布在某条直线附近,则变量间具有线性相关关系;二、相关关系的判定——作散点图如果散点不集中在任何曲线附近,杂乱无章,则变量间不具有相关关系。如果散点自左向右呈上升趋势,则变量间具有正相关;如果散点自左向右呈下降趋势,则变量间具有负相关。如果散点分布在某条函数曲线附近,则变量间具有非线性相关关系;例1:5个学生的数学和物理成绩如下表:ABCDE数学8075706560物理7066686462画出散点图,并判断它们是否有相关关系。物理成绩50556065707580405060708090数学成绩解:由散点图可见,两者之间具有正相关关系。例2:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度-504712151923273136热饮杯数15615013212813011610489937654(1)画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;解:(1)散点图(2)气温与热饮杯数成负相关,表明气温越高,大体上卖出去的热饮杯数就越少。405060708090100110120130140150160-10010203040温度热饮杯数如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线就叫做回归直线。这条回归直线的方程,简称为回归方程。O45505560652025303540年龄脂肪含量510152025303540二、回归直线:1.如果所有的样本点都落在某一函数曲线上,变量之间具有函数关系2.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系3.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系只有散点图中的点呈条状集中在某一直线周围的时候,才可以说两个变量之间具有线性关系,才有两个变量的正线性相关和负线性相关的概念,才可以用回归直线来描述两个变量之间的关系注意:三、如何具体的求出这个回归方程呢?O45505560652025303540年龄脂肪含量510152025303540求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与直线的偏差最小”。如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线就叫做回归直线。思考5:对一组具有线性相关关系的样本数据:(x1,y1),(x2,y2),…,(xn,yn),设其回归方程为可以用哪些数量关系来刻画各样本点与回归直线的接近程度?abxy设已经得到具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn)设所求的回归直线方程为其中a,b是待定的系数。当变量x取x1,x2,…,xn时,可以得到(i=1,2,…,n)它与实际收集得到的之间偏差是(i=1,2,…,n)探索过程如下:这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。(x1,y1)(x2,y2)(xi,yi)(xn,yn)abxyabxyii)(abxyiyyiiiiy的最小值21)(iyynii当a,b取什么值时,Q的值最小,即总体偏差最小2222211)))abxyabxyabxyQnn(((的最小值)(1iyynii的最小值||1iyynii根据有关数学原理分析,当时,总体偏差为最小,这样就得到了回归方程,这种求回归方程的方法叫做最小二乘法.21ˆ()niiiQyyxbyaxnxyxnyxxxyyxxbniiniiiniiniii,)())((1221121(其中,b是回归方程的斜率,a是截距)abxy估计值样本数值yx例:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度热饮杯数-515601504132712812130151161910423892793317636541、画出散点图;2、从散点图中发现气温与热饮销售杯数之间关系的一般规律;3、求回归方程;4、如果某天的气温是2摄氏度,预测这天卖出的热饮杯数。图3-1050100150200-2002040热饮杯数1、散点图2、从图3-1看到,各点散布在从左上角到由下角的区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少。3、从散点图可以看出,这些点大致分布在一条直线的附近,因此利用公式1求出回归方程的系数。Y=-2.352x+147.7674、当x=2时,Y=143.063因此,某天的气温为2摄氏度时,这天大约可以卖出143杯热饮。作业:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗Y(吨标准煤)的几组对照数据x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,崩最小二乘法求出Y关于x的线性回归方程Y=bx+a;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
本文标题:2.3变量间的相关关系(2011.3.8第四周星期二)
链接地址:https://www.777doc.com/doc-3750015 .html