您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 2.3变量间的线性相关关系
有些教师常说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题”按照这种说法,似乎学生的物理成绩与数学成绩之间也存在着某种关系。你如何认识它们之间存在的关系?物理成绩数学成绩学习兴趣学习时间其他因素结论:变量之间除了函数关系外,还有。问题引入:函数关系是一种确定的关系;相关关系与函数关系的异同点:均是指两个变量的关系.相关关系是一种非确定关系.相同点:不同点:新课探究——两个变量之间的关系变量关系有关系没关系函数关系相关关系练习:下列各变量之间是相关关系的序号是.①路程与时间、速度的关系;②人的身高和年龄的关系;③粮食产量与施肥量的关系;④圆周长与半径的关系;⑤广告费支出与销售额的关系.⑥中国足球队的成绩和中国乒乓球队的成绩②③⑤年龄23273941454950脂肪9.517.821.225.927.526.328.2年龄53545657586061脂肪29.630.231.430.833.535.234.6根据上述数据,人体的脂肪含量和年龄之间有怎样的关系?一次对人体的脂肪含量和年龄关系的调查,如图:通过统计图、表,可以使我们对两个变量之间的关系有一个直观上的印象和判断。下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标系,作出各个点,如图:O20253035404550556065年龄脂肪含量510152025303540称该图为散点图。有一个同学家开了一个小超市,他为了研究气温对热饮销销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度261813104-1热饮杯数202434385064为了了解热饮销量与气温的大致关系,我们以气温为横轴,热饮销量为纵轴,建立直角坐标系,散点图气温越高,卖出去的热饮杯数越少。O5101520253035气温y102030405060-5我们再观察刚才两个散点图还有什么特征:这些点大致分布在一条直线附近,像这样如果散点图中点的分布从整体上看大致在一条直线附近我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,这条直线的方程叫做回归方程另外,散点散布在从左下角到右上角的区域,称这两个变量的相关关系为正相关;反之称为负相关.问题一:下列两个散点图中,两个变量之间是否具有线性相关关系?理由呢?是正相关还是负相关?xyxy方案一:采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程。探究:如何具体的求出这个回归方程呢?051015202530354020253035404550556065年龄脂肪含量方案二:在图中选取两点画直线,使得直线两侧的点的个数基本相同。051015202530354020253035404550556065年龄脂肪含量方案三:在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的斜率和截距的平均数,将这两个平均数作为回归方程的斜率和截距。051015202530354020253035404550556065年龄脂肪含量问题2:从上面的研究可知,我们认为以偏差最小的直线作为回归直线比较恰当,那你能用代数式来刻画“从整体上看,各点与此直线的偏差最小”吗?(x1,y1)(x2,y2)(xn,yn)(xi,yi)oxy(x1,y1)(x2,y2)(xi,yi)(xn,yn)用这n个距离之和来刻画各点到直线的“整体距离”是比较合适的,即可以用niiiabxy1abxyii(x1,y1)(x2,y2)(xi,yi)(xn,yn)abxyii由于绝对值使得计算不方便,在实际应用中人们更喜欢用2222211abxyabxyabxyQnn(x1,y1)(x2,y2)(xi,yi)(xn,yn)abxyii2222211abxyabxyabxyQnn这样,问题就归结为:当a,b取什么值时Q最小?即点到直线的“整体距离”最小.abxy2222211abxyabxyabxyQnn这样,问题就归结为:当a,b取什么值时Q最小?即点到直线的“整体距离”最小.abxy这样通过求此式的最小值而得到回归直线的方法,即使得一半数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.根据有关数学原理推导,a,b的值由下列公式给出niiniiiniiniiixnxyxnyxxxyyxxb1221121xbya根据最小二乘法的思想和此公式,利用计算器或计算机可以方便的求得年龄和人体脂肪含量的样本数据的回归方程.例1、假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料使用年限x23456维修费用y2.23.85.56.57.0若由资料知y对x呈线性相关关系,试求(1)线性回归方程的回归系数a,bˆybxa515221512.31.23105iiiiixyxybxx51.2340.08aybx552114,5,90,112.3iiiiixyxxy计算:ˆ1.230.08yx解:制表:i12345∑xi23456yi2.23.85.56.57.0xiyixi220254.411.422.032.542.0112.34916253690小结:回归方程的步骤:1、列表xi,yi,xiyi,xi22、计算211,,,nniiiiixyxxy3、代入公式,求a,b的值4、写出直线方程事件样本数据回归直线方程抽样决定预测选取代表统计意义上反应例2下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据。x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y关于x的线性回归方程ˆ.ybxa(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?3254354645665...(参考数值:)解:(1)散点图略4166.5iiixy4222221345686iix4.5x3.5y2665445356656307864458681......b3.50.74.50.35aybx所求的回归方程为ˆ0.70.35yx(2)(3)071000357035...y100x当时,预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨)x3456y2.5344.5(1)回归直线:观察散点图的特征,如果各点大致分布在一条直线的附近,就称两个变量之间具有线性相关的关系,这条直线叫做回归直线。(2)最小二乘法ˆybxa(3)利用回归直线对总体进行估计。1122211()(),()nniiiiiinniiiixxyyxynxybaybxxxxnx小结:
本文标题:2.3变量间的线性相关关系
链接地址:https://www.777doc.com/doc-3750028 .html