您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 第三节协方差与相关系数
电子课件史册主讲概率论与数理统计•数学期望•方差•协方差与相关系数•矩协方差矩阵•二维正态分布第四章随机变量的数字特征教学基本要求•掌握:常用分布的数字特征。•熟悉:会运用数字特征的基本性质,求随机变量函数的数学期望。•理解:随机变量数字特征(数学期望、方差、标准差、协方差、相关系数、矩)的概念,二维正态分布中参数的概率意义。•了解:切比雪夫不等式,二维正态分布,理解其中参数的概率意义。•重点:常用分布的数字特征。•难点:切比雪夫不等式,随机变量的数字特征。一、协方差的概念及性质三、小结第三节协方差及相关系数二、相关系数的概念、意义、性质前面我们介绍了随机变量的数学期望和方差,对于二维随机变量(X,Y),我们除了讨论X与Y的数学期望和方差以外,还要讨论描述X和Y之间关系的数字特征,这就是本讲要讨论的协方差和相关系数1.问题的提出那么相互独立和若随机变量,YX).()()(YDXDYXD不相互独立和若随机变量YX22)]([)()(YXEYXEYXD)]}.()][({[2)()(YEYXEXEYDXD一、协方差的概念及性质协方差)]}.()][({[),ov(C),,Cov(.)]}()][({[YEYXEXEYXYXYXYEYXEXE即记为的协方差与称为随机变量量2.定义)]}()][({[),Cov(YEYXEXEYX)]([)]([YEYEXEXE.0(2)XY若随机变量和相互独立)]}()][({[2)()()(YEYXEXEYDXDYXD).()(YDXD(1)XY若随机变量和相互独立),(Cov2)()(YXYDXD3.说明的联合概率密度函数设二维连续随机变量),(YX(,)fxy为(,)()()(,)CovXYxEXyEYfxydxdy4.协方差的计算公式的联合分布律为设二维离散型随机变量),(YX(,),1,2,;1,2,ijijPXxYypij11(,)()()ijijijCovXYxEXyEYp4.协方差的计算公式);()()(),Cov()1(YEXEXYEYX(2)()()()2Cov(,).DXYDXDYXY证明)]}()][({[),Cov()1(YEYXEXEYX)]()()()([YEXEYXEXYEXYE).()()(YEXEXYE)()()()(2)(YEXEYEXEXYE5.性质(2)Cov(,)Cov(,);XYYX(3)Cov(,)Cov(,),,;aXbYabXYab为常数1212(5)Cov(,)Cov(,)Cov(,).XXYXYXY(1)Cov(X,X)=D(X)(4)Cov(X,C)=0,C为常数;协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受X与Y本身度量单位的影响.例如:Cov(kX,kY)=k2Cov(X,Y)为了克服这一缺点,对协方差进行标准化,这就引入了相关系数.二、相关系数2定义称方差都存在的数学期望设随机变量,,,YX)()(),(YDXDYXCovXYXY为随机变量与的)()(,)()(**YDYEYYXDXEXX令的标准化随机变量分别称为YXYX,,**相关系数XY注意:无量纲****()0,()1,()0,()1EXDXEYDY****(,)(,)()()()XYCovXYCovXYEXYDXDY称为标准协方差例设(X,Y)服从区域D:0x1,0yx上的均匀分布,求X与Y的协方差与相关系数.D1x=yothersDyxyxf0),(2),(解:相关系数的性质:11||.证:由方差的性质和协方差的定义知,对任意实数b,有0≤D(Y-bX)=b2D(X)+D(Y)-2bCov(X,Y))(),(XDYXCovb令,则上式为D(Y-bX)=)()],([)(2XDYXCovYD])()()],([1)[(2YDXDYXCovYD]1)[(2YD2.X和Y独立时,=0,但其逆不真.由于当X和Y独立时,Cov(X,Y)=0.故)()(),(YDXDYXCov=00但由并不一定能推出X和Y独立.考虑以X的线性函数a+bX来近似表示Y,以均方误差e=E{[Y-(a+bX)]2}来衡量以a+bX近似表示Y的好坏程度,e值越小表示a+bX与Y的近似程度越好.用微积分中求极值的方法,求出使e达到最小时的a,b.相关系数刻划了X和Y间“线性相关”的程度.=E(Y2)+b2E(X2)+a2-2bE(XY)+2abE(X)-2aE(Y)e=E{[Y-(a+bX)]2}0)(2)(2)(20)(2)(222XaEXYEXbEbeYEXbEaae)(),(0XDYXCovb解得)()(00XEbYEa这样求出的最佳逼近为L(X)=a0+b0X这样求出的最佳逼近为L(X)=a0+b0X这一逼近的剩余是若=0,Y与X无线性关系;Y与X有严格线性关系;,1若可见,若0||1,||的值越接近于1,Y与X的线性相关程度越高;||的值越接近于0,Y与X的线性相关程度越弱.E[(Y-L(X))2]=D(Y)(1-)24.若,称X和Y不相关。0XY定理:若随机变量X与Y的方差都存在,且均不为零;则下列四个命题等价。0XY(1);(2)cov(X,Y)=0;(3)E(XY)=EXEY;(4)D(X±Y)=DX+DY。前面,我们已经看到:若X与Y独立,则X与Y不相关,但由X与Y不相关,不一定能推出X与Y独立.1例的联合概率分布如下:设二维随机变量),(YX但不是相互独立不相关与证明,:YX证明:的边缘概率分布分别是与YX31113100311)1(),(YXCov0]321310][31131031)1[(不相关。与所以YX913131..310000ppp由XY知与不是相互独立的2例),(UX~设,,21CosXXSinXX21XX求解:的概率密度为随机变量X其它,0),(,21)(xxf021)()()(1SinxdxdxxSinxfSinXEXE021)()()(2CosxdxdxxCosxfCosXEXE)()(21SinXCosXEXXE021)(SinxCosxdxxdxSinxCosxf所以0)()()(),(212121XEXEXXEXXCov21XX0即21,XX不相关22121XX但,)()(,0)()()1(2YDXDYEXE解例设X,Y相互独立且都服从正态分布N(0,2)bYaXDbYaXDD)()(22222)()()(baYDbXDa)()(bYaXDD22222)()()(baYDbXDa(1)求;(2)是否相关?,,,.aXbYaXbY又0)()()()(YbEXaEbYaXEE0)()()()(YbEXaEbYaXEE)()()()()()()()()(2222222222,babababaDDEEE所以)()(2222YbXaEE22222)()()(baYDbXDa)()(2222YEbXEa.)35(,,),(YXDYXCovXY求.,0,10,0,),(其它xxyAxyyxf;,,0,相关时当ba;,,0,)2(不相关时当ba例设(X,Y)的联合概率密度为解:由,则1),(dxdyyxf8,18100AAdxAxydyx,548100dxxydyxXEx,1588100dxxydyyYExXEXEXD22,75254821002dxxydyxxYEYEYD22,2254158548100dxxydyxyxYEXEXYEYXCov,,22511158821002dxxydyyx,22334,YDXDYXCovXYYXCovYDXDYXD3,5235357543,3523522YXCovYDXD三、小结相关系数的意义.,,的线性相关程度较高较大时当YXρXY.,,的线性相关程度较差较小时当YXρXY.,0不相关YXρXY和时当今日作业:P1131、3~7预习:第四节和第五节谢谢大家!
本文标题:第三节协方差与相关系数
链接地址:https://www.777doc.com/doc-1799947 .html