您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 2.3变量间的相关关系
Office组件之word2007Office组件之word20072.3变量间的相关关系Office组件之word2007Office组件之word2007一、变量之间的关系1.确定关系当一个量确定,另一个也确定下来时,称两个变量是确定关系。(1)龙生龙、凤生凤、老鼠儿子打地洞(生物意义上解释)(2)y=2x+1中,y与x的关系(3)三角形三边长与三角形面积的关系特殊确定关系:函数关系我们学过函数,知道两个变量之间的关系有函数关系,有时可以用明确关系是表达出来。Office组件之word2007Office组件之word2007一、变量之间的关系2.相关关系两个变量是有关联的,但关系不确定,这样的关系称为相关关系。(1)公鸡打鸣与太阳升起(2)数学成绩与物理成绩(3)父亲和儿子的身高体重著名案例:吸烟与肺癌有关?两个变量是有关联的,但关系不确定。1.现象之间确实存在着数量上的依存关系2.现象之间数量上的关系是不确定、不严格的依存关系。Office组件之word2007Office组件之word2007由于相关关系的不确定性,在寻找变量之间的相关关系的过程中,统计发挥着重要作用。我们可以通过收集大量的数据,在对数据分析统计的基础上,发现其中的规律,对它们之间的关系做出判断。对具有相关关系的两个变量进行统计分析的方法叫做回归分析。通俗地讲,回归分析就是寻找相关关系中非确定关系的某种确定性。二、回归分析Office组件之word2007Office组件之word2007线性相关——最简单的相关关系在一次对人体脂肪含量和年龄关系的研究,获得了一组样本数据:其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.年龄23273941454950脂肪9.517.821.225.927.526.328.2年龄53545657586061脂肪29.630.231.430.833.535.234.6思考1:年龄与脂肪含量有没有关系?依据是什么?思考2:有没有更加定量的分析方法,进行定量研究?Office组件之word2007Office组件之word2007在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图051015202530354020253035404550556065年龄脂肪含量►上例中散点图从左下角到右上角,即一个变量从小到大变化时,另一个变量小大到大变化。这种关系称为正相关关系。否则称为负相关关系。三、散点图Office组件之word2007但有的两个变量的相关,如下图所示:如高原含氧量与海拔高度的相关关系,海平面以上,海拔高度越高,含氧量越少。作出散点图发现,它们散布在从左上角到右下角的区域内,称它们成负相关.Office组件之word2007Office组件之word2007练习:下列图形中两个变量具有相关关系的是()yox(A)yox(B)yox(C)yox(D)COffice组件之word2007Office组件之word2007思考:当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?02025303545505560x年龄510152025303540y脂肪含量4065这些点大致分布在一条直线附近,像这样如果散点图中的点的分布从整体上看大致在一条直线附近我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,这条直线的方程叫做回归方程02025303545505560x年龄510152025303540y脂肪含量4065人们经过长期的实践与研究,已经找到了计算回归方程的较为科学的方法:02025303545505560x年龄510152025303540y脂肪含量4065人们经过长期的实践与研究,已经找到了计算回归方程的较为科学的方法:02025303545505560x年龄510152025303540y脂肪含量4065,iixy,iixbxa()iiiiiqybxaybxaAB人们经过长期的实践与研究,已经找到了计算回归方程的较为科学的方法:距离之和:121122nnnqqqqybxaybxaybxa越小越好人们经过长期的实践与研究,已经找到了计算回归方程的较为科学的方法:点到直线距离的平方和:2221122()nnQybxaybxaybxa取最小值xbyaxnxyxnyxxxyyxxbniiniiiniiniii,)())((1221121人们经过长期的实践与研究,已经找到了计算回归方程的较为科学的方法:以上公式的推导较复杂,故不作推导,这一方法叫最小二乘法。回归方程为ybxa符号说明及思想.,,,,..ˆ,,),,,(.ˆ,ˆ.bababxayxyynixxyyybxayiiiii关键是求回归系数求回归直线方程叫做回归系数的纵坐标是对于而直线上相应的观察值为时的取值为即当的实际取值是为了区别于这里设回归直线方程为2211niiiniiiiiiiiiiiiiiiyyyyyynyybxayyybxayyynixx121654213.)ˆ(,..ˆ,,ˆ..ˆ..)(ˆ,ˆ,,),,,(.最终改用为运算方便来表示用为了避免互相抵消可正可负由于小个偏差构成的总偏差最的与希望来刻画偏差用上的对应回归直线的观察值为时的取值为当最小二乘法取值如下:取最小值时可求得应用配方法二次多项式的展开后是关于设baQbabxayyyQniniiiii,,,,,,)()ˆ(11221122211()(),()nniiiiiinniiiixxyyxynxybaybxxxxnx►上述方法称为最小二乘法►回归直线方程是否过定点?你知道是哪个点吗?).,(,)(ˆ,,ˆyxyxxbxbybxyxbyaabxy所以回归直线方程过点代入得线性回归方程计算步骤►第一步,计算平均数►第二步,求和►第三步,计算►第四步,写出回归方程xy1niiixy21niix1122211()(),()nniiiiiinniiiixxyyxynxybaybxxxxnxbxayˆ高考不允许使用计算器,为了减少计算错误,建议采用列表的方式分步计算i12……nxix1x2……xnyiy1y2……ynxiyix1y1x2y2……xnynxi2x12x22……xn2xy1niiixy21niix年龄23273941454950脂肪9.517.821.225.927.526.328.2年龄53545657586061脂肪29.630.231.430.833.535.234.6思考:当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?i1234567xi23273941454950yi9.517.821.225.927.526.328.2xiyi218.5480.6826.81061.91237.51288.71410i891011121314xi53545657586061yi29.630.231.430.833.535.234.6xiyi1568.81630.81758.41755.6194321122110.6解:1、设回归方程2、列表ybxa3、计算48.071,27.264xy141421134181,19403.3iiiiixxy4489.0071.48577.0264.275765.032351.495-3418118348.508-3.19403141414122141xbyaxxyxyxbiiiii4、代入公式求的值,ba5、写出回归直线的回归方程0.57650.4489yx关于回归方程的几点思考►如果给出了,当某人37岁时,代表什么?►能不能说,当我到了37岁时,体内脂肪含量一定是20.90%?►如果随便给出任意关系的两个变量的一组数据,能否也用上述方法求出回归直线方程?有没有意义?448.0577.0ˆxy求回归直线方程的步骤2、列表3、计算4、代入公式求的值,ba5、写出回归直线的回归方程211,,,nniiiiixyxxy1、设回归方程例1、有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度-504712151923273136热饮杯数156150132128130116104899376541、从散点图中发现气温与热饮销售杯数之间关系的一般规律;2、求回归方程;(已知:)3、如果某天的气温是2摄氏度,预测这天卖出的热饮杯数。摄氏温度-504712151923273136热饮杯数15615013212813011610489937654020406080100120140160180-10-50510152025303540热饮杯数热饮杯数xy15.364,111.636xy11112114335,14778iiiiixxy解:1、各点散布在从左上角到由下角的区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少。2、回归方程为:2.352147.767yx3、当x=2时,因此,某天的气温为2摄氏度时,这天大约可以卖出143杯热饮。143.063y练习:实验测得四组(x,y)的值如下表所示:x1234y2345则y与x之间的回归直线方程为()(参考数值:).1Ayx.2Byx.21Cyx.1Dyx442112.5,3.5,30,40iiiiixyxxyA总结提升:基础知识框图表解变量间关系函数关系相关关系散点图线性相关线性回归方程课堂检测:1、对变量x,y观测数据(xi,yi)(i=1,2,...,10),得散点图1;对变量u,v有观测数据(ui,vi)(i=1,2,...,10),得散点图2,由这两个散点图可判断()yxovou图1图2A、变量x与y正相关,u与v正相关;B、变量x与y正相关,u与v负相关;C、变量x与y负相关,u与v正相关;D、变量x与y负相关,u与v负相关;C课堂检测:2、某市居民2005-2009年家庭平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表:年份20052006200720082009收入x11.512.11313.315支出Y6.88.89.81012家庭年平均收入与年平均支出有线性相关关系?正课堂检测:3.假设关于某种设备的使用年限x和支出的维修费用y(万元)有以下的统计资料使用年限23456维修费用2.23.85.56.57.0(1)求支出的维修费用y与使用年限x的回归方程;(2)估计使用年限为10年时,维修费用是多少?参考数值:22.233.845.556.567.0112.31.230.08yx约为12.38备选练习:已知变量x与变量y有下列对应数据:x1234y0.51.523则y对x的回归直线方程为
本文标题:2.3变量间的相关关系
链接地址:https://www.777doc.com/doc-3750023 .html