您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 绩效管理 > 《变量之间的相关关系》课件
基础知识框图表解变量间关系函数关系相关关系散点图线形相关线形回归方程问题提出和探究在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?上述两个变量之间的关系是一种非确定性关系,称之为相关关系。一、变量之间的相关关系不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系.相关关系与函数关系的异同点:相同点:均是指两个变量的关系.尝试练习一现实生活中存在许多相关关系,在下列两个变量的关系中,哪些是相关关系?①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③人的身高与体重之间的关系;④人的身高与视力之间的关系;⑤商品销售收入与广告支出经费之间的关系;⑥粮食产量与施肥量之间的关系;⑦匀速行驶的车辆的行驶距离与时间×××通过收集两个变量的大量数据,进行统计和数据分析,找出其中的规律,对其相关关系的程度作出一定判断.由于变量之间相关关系的广泛性和不确定性,所以样本数据应较大,和有代表性.才能对它们之间的关系作出正确的判断.如何判断两个变量之间是否具有相关关系以及相关程度的强弱在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.年龄23273941454950脂肪9.517.821.225.927.526.328.2年龄53545657586061脂肪29.630.231.430.833.535.234.6根据上述数据,人体的脂肪含量与年龄之间有怎样的关系?实例探究思考1:对某一个人来说,他的体内脂肪含量不一定随年龄增长而增加或减少,但是如果把很多个体放在一起,就可能表现出一定的规律性.观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?年龄23273941454950脂肪9.517.821.225.927.526.328.2年龄53545657586061脂肪29.630.231.430.833.535.234.6思考2:为了确定人体脂肪含量和年龄之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?O45505560652025303540年龄脂肪含量510152025303540思考3:右图叫做散点图在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.观察散点图的大致趋势,两个变量的散点图中点的分布的位置是从左下角到右上角的区域,我们称这种相关关系为正相关。O45505560652025303540年龄脂肪含量510152025303540O思考4:如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?散点图中的点散布在从左上角到右下角的区域.注:若两个变量散点图呈上图,则不具有相关关系。020406080100120020406080100例1、以下是2000年某地搜集到的新房屋的销售价格和房屋的面积的数据:房屋面积(平方米)617011511080135105销售价格(万元)12.215.324.821.618.429.222画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关.05101520253035050100150面积售价房屋面积(平方米)617011511080135105销售价格(万元)12.215.324.821.618.429.222如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线就叫做回归直线。这条回归直线的方程,简称为回归方程。二、回归直线O45505560652025303540年龄脂肪含量5101520253035401.如果所有的样本点都落在某一函数曲线上,变量之间具有函数关系2.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系3.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系只有散点图中的点呈条状集中在某一直线周围的时候,才可以说两个变量之间具有线性关系,才有两个变量的正线性相关和负线性相关的概念,才可以用回归直线来描述两个变量之间的关系有关说明三、如何具体的求出这个回归方程呢?O45505560652025303540年龄脂肪含量510152025303540求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与直线的偏差最小”。如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线就叫做回归直线。思考5:对一组具有线性相关关系的样本数据:(x1,y1),(x2,y2),…,(xn,yn),设其回归方程为可以用哪些数量关系来刻画各样本点与回归直线的接近程度?abxy设已经得到具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn)设所求的回归直线方程为其中a,b是待定的系数。当变量x取x1,x2,…,xn时,可以得到(i=1,2,…,n)它与实际收集得到的之间偏差是(i=1,2,…,n)探索过程如下:这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。(x1,y1)(x2,y2)(xi,yi)(xn,yn)abxyabxyii)(abxyiyyiiiiy的最小值21)(iyynii当a,b取什么值时,Q的值最小,即总体偏差最小2222211)))abxyabxyabxyQnn(((的最小值)(1iyynii的最小值||1iyynii根据有关数学原理分析,当时,总体偏差为最小,这样就得到了回归方程,这种求回归方程的方法叫做最小二乘法.21ˆ()niiiQyyxbyaxnxyxnyxxxyyxxbniiniiiniiniii,)())((1221121(其中,b是回归方程的斜率,a是截距)abxy估计值样本数值yx0.577×65-0.448=37.1思考6:利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程为由此我们可以根据一个人的年龄预测其体内脂肪含量的百分比的回归值.若某人65岁,则其体内脂肪含量的百分比约为多少?448.0577.0xy能不能说他体内脂肪含量一定是37.1%?若某人65岁,可预测他体内脂肪含量在37.1%(0.577×65-0.448=37.1%)附近的可能性比较大。但不能说他体内脂肪含量一定是37.1%原因:线性回归方程中的截距和斜率都是通过样本估计的,存在随机误差,这种误差可以导致预测结果的偏差,即使截距斜率没有误差,也不可能百分百地保证对应于x,预报值能等于实际值yy例2、(07广东)下表提供了某厂节油降耗技术发行后生产甲产品过程中记录的产量(吨)与相应的生产能耗y(吨标准煤)的几组对应数据.X3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)axb4166.5iiiXY4222221345686iiX4.5X3.5Y266.544.53.566.563ˆ0.78644.58681bˆˆ3.50.74.50.35aYbX所求的回归方程为0.70.35yx(2)解:100x(3)1000.70.3570.35y预测生产100吨甲产品的生产能耗比技改前降低(吨)9070.3519.65例2、有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度热饮杯数-515601504132712812130151161910423892793317636541、画出散点图;2、从散点图中发现气温与热饮销售杯数之间关系的一般规律;3、求回归方程;4、如果某天的气温是2摄氏度,预测这天卖出的热饮杯数。图3-1050100150200-2002040热饮杯数1、散点图2、从图3-1看到,各点散布在从左上角到由下角的区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少。3、从散点图可以看出,这些点大致分布在一条直线的附近,因此利用公式1求出回归方程的系数。Y=-2.352x+147.7674、当x=2时,Y=143.063因此,某天的气温为2摄氏度时,这天大约可以卖出143杯热饮。本节重点知识回顾1、相关关系(1)概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系。(2)相关关系与函数关系的异同点。相同点:两者均是指两个变量间的关系。不同点:函数关系是一种确定关系,是一种因果系;相关关系是一种非确定的关系,也不一定是因果关系(但可能是伴随关系)。(3)相关关系的分析方向。在收集大量数据的基础上,利用统计分析,发现规律,对它们的关系作出判断。2、两个变量的线性相关(1)回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析。通俗地讲,回归分析是寻找相关关系中非确定关系的某种确定性。(2)散点图A、定义;B、正相关、负相关。3、回归直线方程注:如果关于两个变量统计数据的散点图呈现发散状,则这两个变量之间不具有相关关系.3、回归直线方程(1)回归直线:观察散点图的特征,如果各点大致分布在一条直线的附近,就称两个变量之间具有线性相关的关系,这条直线叫做回归直线。(2)最小二乘法nn(x-x)(y-y)xy-nxyiiiii=1i=1b==,nn222(x-x)x-nxiii=1i=1a=y-bx.nn11x=x,y=y.iinni=1i=1其中ˆybxa(3)利用回归直线对总体进行估计练习2-1、观察两相关量得如下数据:x-1-2-3-4-553421y-9-7-5-3-115379101022110,0,110,330,110.iiiiiixyyyxx求两变量间的回归方程.解:列表:i12345678910x-1-2-3-4-553421y-9-7-5-3-115379xiyi9141512551512149计算得:1011022110110100111010010iiiiixybyxxx000aybxb.yx所求回归直线方程为注意:求回归直线方程的步骤:,,;iiiiyyxx22111,,,,nnniiiiiiixyyyxx第一步:列表第二步:计算:第三步:代入公式计算b,a的值第四步:列出直线方程。练习2-2、:给出施化肥量对水稻产量影响的试验数据:施化肥量x15202530354045水稻产量y330345365405445450455(1)画出上表的散点图;(2)求出回归直线并且画出图形.从而得回归直线方程是3.399,30yx777221117000,1132725,87175iiiiiiixyxy2573075.43.399,75.430770003.399307871752ab^4.75257yx解:(1)散点图(略).(2)表中的数据进行具体计算,列成以下表格20475180001557512150912569004950xiyi455450445405365345330yi45403530252015xi76
本文标题:《变量之间的相关关系》课件
链接地址:https://www.777doc.com/doc-4540163 .html