您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 相关系数-北师大版-选修2-3
相关系数1、两个变量的关系不相关相关关系函数关系线性相关非线性相关相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。复习回顾相关关系给出两个变量,当一个变量一定时,另一个变量的取值具有一定的随机性1、注意与函数关系的区别2、回归分析散点图将样本中的所有数据点(xi,yi),描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形2、最小二乘估计下的线性回归方程:2n12n1__2n1__)n()xxxxxxyxxbiiiiiiiniiiyny()y)((12)a,b的意义是:以a为基数,x每增加1个单位,y相应地平均增加b个单位。1)称为样本点的中心。(x,y)xbyaaxby(1)计算平均数(2)计算与的积,求(3)计算(4)将上述有关结果代入公式,求b、a,写出回归直线方程.,xyixiy1niiixy2211,nniiiixy3、求线性回归方程的步骤:4、回归分析的基本步骤:A.画散点图B.求回归方程C.用回归直线方程解决应用问题求线性回归方程的步骤:(1)计算平均数(2)计算与的积,求(3)计算(4)将上述有关结果代入公式,求b、a,写出回归直线方程.,xyixiy1niiixyniix12相关性1、在散点图中,点有一个集中的大致趋势2、在散点图中,所有的点都在一条直线附近波动----线性相关。xxxyyyOOO问题:有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义。在怎样的情况下求得的回归直线方程才有实际意义?即建立的线性回归模型是否合理?如何对一组数据之间的线性相关程度作出定量分析?需要对x,y的线性相关性进行检验从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似描述,这种近似的过程称为曲线拟合。在两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的。此时,我们可以用一条直线来拟合,这条直线叫回归直线。xyO051015202530354020253035404550556065年龄脂肪含量思考:观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?年龄与脂肪的散点图,从整体上看,它们是线性相关的051015202530354020253035404550556065年龄脂肪含量思考2:在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.一般地,如果两个变量成正相关,那么这两个变量的变化趋势如何?思考3:如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域.这就像函数中的增函数和减函数。即一个变量从小到大,另一个变量也从小到大,或从大到小。思考4:你能列举一些生活中的变量成正相关或负相关的实例吗?年龄与身高是正相关,网速与下载文件所需时间是负相关。例2.5个学生的数学和物理成绩如下表:学生学科ABCDE数学8075706560物理7066686462画出散点图,并判断它们是否有相关关系.数学物理具有相关关系.例3.下表给出了某校12名高一学生的身高(单位:cm)和体重(单位:kg):画出散点图,并观察它们是否有相关关系.身高体重具有相关关系.思考:如何分析变量之间是否具有相关的关系?分析变量之间是否具有相关的关系,我们可以借助日常生活和工作经验对一些常规问题来进行定性分析,如儿童的身高随着年龄的增长而增长,但它们之间又不存在一种确定的函数关系,因此它们之间是一种非确定性的随机关系,即相关关系。散点图也只是形象地描述点的分布情况,它的“线性”是否明显只能通过观察,但仅凭这种定性分析不够;要想把握其特征,必须进行定量的研究.相关系数niii=1nn22iii=1i=1(x-x)(y-y)r=(x-x)(y-y)2_n1i2i2n1i2in1i__ii)yn(y)xn(xyxnyx相关系数r的性质:(2);1r(3)越接近于1,x,y的线性相关程度越强;r(4)越接近于0,x,y的线性相关程度越弱;r.,0;,0表明两个变量负相关时当表明两个变量正相关时当rr(1)思考交流对于课本P73给出的例题,变量的线性相关系数r如何求?我们知道,相关系数的计算公式为:要求r,只需求出相关的量:niiiyx1,,,niix12niiy12和。xyniiniiniiiynyxnxyxnyxr1221221,,可得,,,20040niiiyx117633niix1222790niiy122585291.x665330y由数据表,经过计算,可知:9941.0665227902.58517633662.5852004022r这能说明什么??这说明肱骨和股骨有较强的线性相关程度。yx计算下表变量的线性相关系数r。并观察,通过计算可以发现什么?根据数据列表计算如下:解析:,,则可得0x71.2y00121niix5127niiy0niiiyx1,,,071.27750710071.207022r你发现什么了??r=0,则变量间并不存在线性相关关系。即此时建立线性回归方程是没有意义的。实际上,从散点图上我们也可以验证这一点:易看出,几个样本点都落在同一个半圆上,而不是条状分布,此时建立线性回归方程无任何意义,这与相关系数r的计算结果相一致。1.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大()A.EB.CC.DD.AA2、对于散点图下列说法中正确一个是()A.通过散点图一定可以看出变量之间的变化规律B.通过散点图一定不可以看出变量之间的变化规律C.通过散点图可以看出正相关与负相关有明显区别D.通过散点图看不出正相关与负相关有什么区别CA32_n1i2i2n1i2in1i__ii)yn(y)xn(xyxnyxr2n12n1__2n1__)n()xxxxxxyxxbiiiiiiiniiiyny()y)((1拓展思考相关系数r越大,变量间的线性关系就越强,那么r的值究竟大到什么程度就认为线性关系较强??n(x-x)(y-y)iii=1r=nn22(x-x)×(y-y)iii=1i=1相关系数r>0正相关;r<0负相关.通常,r∈[-1,-0.75]--负相关很强;r∈[0.75,1]—正相关很强;r∈[-0.75,-0.3]--负相关一般;r∈[0.3,0.75]—正相关一般;r∈[-0.25,0.25]--相关性较弱;相关关系的测度(相关系数取值及其意义)-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加小结*线性相关系数r:值越大,误差越小,则变量的线性相关程度就越高;值越接近于0,越大,线性相关程度就越低。rrQQ*,其中。niiniiniiiynyxnxyxnyxr122122111r当时,两变量正相关;当时,两变量负相关;当时,两变量线性不相关。0r0r0r*书面作业1、课本P85习题3—1第1,2题2、《名师一号》P65梯度训练阅读作业《名师一号》P64和P65小结1、相关关系的判断2、画散点图3、线性关系系数例1.下表给出我国从1949至1999年人口数据资料,试根据表中数据估计我国2004年的人口数.检验:(1)作统计假设H0:x与y不具有线性相关关系;(2)由0.05与n-2=9,在附录1中查的r0.05=0.602;(3)根据公式求的线性相关系数r=0.998;(4)因为|r|=0.9980.602,即|r|r0.05,所以有95%的把握认为x与y之间具有线性相关关系,线性相关回归方程y=527.591+14.453x是有意义的.年份4954596469747984899499人口数/百万5426036727058079099751035110711771246
本文标题:相关系数-北师大版-选修2-3
链接地址:https://www.777doc.com/doc-4562908 .html