您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 绩效管理 > 变量之间的相关关系..
2.3变量间的相关关系前面我们学习了怎样对收集来的数据进行分析:频率分布图离散程度集中趋势下面我们来介绍一中更为常见的分析方法:小明,你数学成绩不太理想,物理怎么样?也不太好啊.学不好数学,物理也是学不好的?????...你认为老师的说法对吗?事实上,我们在考察数学成绩对物理成绩影响的同时,还必须考虑到其他的因素:爱好,努力程度如果单纯从数学对物理的影响来考虑,就是考虑这两者之间的相关关系我们在生活中,碰到很多相关关系的问题:物理成绩数学成绩学习兴趣花费时间其他因素商品销售收入K×广告支出经费?粮食产量K×施肥量?付出K×收入?人体脂肪含量K×年龄?1〉商品销售收入与广告支出经费之间的关系。商品销售收入与广告支出经费之间有着密切的联系,但商品收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关。我们还可以举出现实生活中存在的许多相关关系的问题。例如:在一定范围内,施肥量越大,粮食产量就越高。但是,施肥量并不是决定粮食产量的唯一因素,因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响。2〉粮食产量与施肥量之间的关系。在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关。3〉人体内脂肪含量与年龄之间的关系。应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”。但是,不管你经验多么丰富,如果只凭经验办事,还是很容易出错的。因此,在分析两个变量之间的关系时,我们还需要有一些有说服力的方法。自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.变量间相关关系的概念:相同点:两者均是指两个变量间的关系.不同点:①函数关系是一种确定的关系;相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是随机变量与随机变量间的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.相关关系与函数关系的异同点:请同学们回忆一下,我们以前是否学过变量间的关系呢?两个变量间的函数关系.1.下列关系中,是带有随机性相关关系的是.①正方形的边长与面积的关系;②水稻产量与施肥量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故发生之间的关系.②③④2.下列两个变量之间的关系哪个不是函数关系()A.角度和它的余弦值B.正方形边长和面积C.正n边形的边数和它的内角和D.人的年龄和身高D即学即用在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用,变量之间的相关关系带有不确定性,这需要通过大量的数据,对数据进行统计分析,发现规律,才能作出科学的判断。对具有相关关系的两个变量进行统计分析的方法叫回归分析相关关系是进行回归分析的基础,同时,也是散点图的基础。【问题】在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.年龄23273941454950脂肪9.517.821.225.927.526.328.2年龄53545657586061脂肪29.630.231.430.833.535.234.6思考1:对某一个人来说,他的体内脂肪含量不一定随年龄增长而增加或减少,但是如果把很多个体放在一起,就可能表现出一定的规律性.观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?年龄23273941454950脂肪9.517.821.225.927.526.328.2年龄53545657586061脂肪29.630.231.430.833.535.234.6思考2:为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?051015202530354020253035404550556065年龄脂肪含量思考3:上图叫做散点图.在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.散点图:用来判断两个变量是否具有相关关系.思考4:观察散点图的大致趋势,人的年龄与人体脂肪含量具有什么相关关系?051015202530354020253035404550556065年龄脂肪含量在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.一般地,如果两个变量成正相关,那么这两个变量的变化趋势如何?思考6:如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?思考7:你能列举一些生活中的变量成正相关或负相关的实例吗?正相关的特点:一个变量随另一个变量的变大而变大,散点图中的点散布在从左下角到右上角的区域负相关的特点:一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域如高原含氧量与海拔高度的相关关系,海平面以上,海拔高度越高,含氧量越少。作出散点图发现,它们散布在从左上角到右下角的区域内。又如汽车的载重和汽车每消耗1升汽油所行使的平均路程,称它们成负相关.O探究:观察人体的脂肪含量百分比和年龄的样本数据的散点图,这两个相关变量成正相关.我们需要进一步考虑的问题是,当人的年龄增加时,体内脂肪含量到底是以什么方式增加呢?2040305010302040脂肪含量)60010年龄2040305010302040脂肪含量)60010年龄讨论:有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?2040305010302040脂肪含量)60010年龄这些点大致分布在一条直线附近.2040305010302040脂肪含量)60010年龄如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.并根据回归方程对总体进行估计.2040305010302040脂肪含量)60010年龄如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.2040305010302040脂肪含量)60010年龄讨论:1、每个同学画的直线相同吗?2、你认为回归直线有很多条吗?3、你可以求出直线方程吗?大家的建议都有一定的道理,但总让人感到可靠性不强.回归直线与散点图中各点的位置用数学的方法来刻画应具有怎样的关系?从整体上看,各点与此直线最接近,距离最小.你能解释这句话的含义吗?(x1,y1)(x2,y2)(xi,yi)(xn,yn)讨论:对一组具有线性相关关系的样本数据:(x1,y1),(x2,y2),…,(xn,yn),设其回归方程为,可以用哪些数量关系来刻画各样本点与回归直线的接近程度?abxy(x1,y1)(x2,y2)(xi,yi)(xn,yn)我们可以用点(xi,yi)与这条直线上横坐标为xi的点之间的距离来刻画点(xi,yi)到直线的远近.),,3,2,1(niabxyii为了从整体上反映n个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适?(x1,y1)(x2,y2)(xi,yi)(xn,yn)用这n个距离之和来刻画各点到直线的“整体距离”是比较合适的,即可以用niiiabxy1表示各点到直线的“整体距离”.abxy(x1,y1)(x2,y2)(xi,yi)(xn,yn)用这n个距离之和来刻画各点到直线的“整体距离”是比较合适的,即可以用niiiabxy1abxyii例2:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度-504712151923273136热饮杯数15615013212813011610489937654(1)画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;(x1,y1)(x2,y2)(xi,yi)(xn,yn)abxyii由于绝对值使得计算不方便,在实际应用中人们更喜欢用2222211abxyabxyabxyQnn(x1,y1)(x2,y2)(xi,yi)(xn,yn)abxyii2222211abxyabxyabxyQnn这样,问题就归结为:当a,b取什么值时Q最小?即点到直线的“整体距离”最小.abxy2222211abxyabxyabxyQnn这样,问题就归结为:当a,b取什么值时Q最小?即点到直线的“整体距离”最小.abxy这样通过求此式的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.根据有关数学原理推导,a,b的值由下列公式给出niiniiiniiniiixnxyxnyxxxyyxxb1221121xbya根据最小二乘法的思想和此公式,利用计算器或计算机可以方便的求得年龄和人体脂肪含量的样本数据的回归方程.例2、有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度热饮杯数-515601504132712812130151161910423892793317636541、画出散点图;2、从散点图中发现气温与热饮销售杯数之间关系的一般规律;3、求回归方程;4、如果某天的气温是2摄氏度,预测这天卖出的热饮杯数。图3-1050100150200-2002040热饮杯数1、散点图2、从图3-1看到,各点散布在从左上角到由下角的区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少。3、从散点图可以看出,这些点大致分布在一条直线的附近,因此利用公式1求出回归方程的系数。Y=-2.352x+147.7674、当x=2时,Y=143.063因此,某天的气温为2摄氏度时,这天大约可以卖出143杯热饮。1.对于两个变量之间的关系,有函数关系和相关关系两种,其中函数关系是一种确定性关系,相关关系是一种非确定性关系.3.一般情况下两个变量之间的相关关系成正相关或负相关,类似于函数的单调性.2.散点图能直观反映两个相关变量之间的大致变化趋势.课堂小结4、求样本数据的线性回归方程,可按下列步骤进行:第一步,计算平均数,xy1niiixy21niix第二步,求和,1122211()()ˆˆ,()nniiiiiinniiiixxyyxynxybaybxxxxnx第三步,计算第四步,写出回归方程ˆˆybxa
本文标题:变量之间的相关关系..
链接地址:https://www.777doc.com/doc-5928579 .html