您好,欢迎访问三七文档
概率论第三节协方差及相关系数协方差相关系数课堂练习小结布置作业概率论前面我们介绍了随机变量的数学期望和方差,对于二维随机变量(X,Y),我们除了讨论X与Y的数学期望和方差以外,还要讨论描述X和Y之间关系的数字特征,这就是本讲要讨论的协方差和相关系数概率论量E{[X-E(X)][Y-E(Y)]}称为随机变量X和Y的协方差,记为Cov(X,Y)(covariance),即⑶Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)⑴Cov(X,Y)=Cov(Y,X)一、协方差2.简单性质⑵Cov(aX,bY)=abCov(X,Y)a,b是常数Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}1.定义概率论Cov(X,Y)=E(XY)-E(X)E(Y)可见,若X与Y独立,Cov(X,Y)=0.3.计算协方差的一个简单公式由协方差的定义及期望的性质,可得Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)=E(XY)-E(X)E(Y)即概率论D(X+Y)=D(X)+D(Y)+2Cov(X,Y)4.随机变量和的方差与协方差的关系特别地)()()(),(22XDXEXEXXCov概率论协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受X与Y本身度量单位的影响.例如:Cov(kX,kY)=k2Cov(X,Y)为了克服这一缺点,对协方差进行标准化,这就引入了相关系数.概率论二、相关系数为随机变量X和Y的相关系数.定义:设D(X)0,D(Y)0,)()(),(YDXDYXCovXY称在不致引起混淆时,记为.XY概率论相关系数的性质:11||.证:由方差的性质和协方差的定义知,对任意实数b,有0≤D(Y-bX)=b2D(X)+D(Y)-2bCov(X,Y))(),(XDYXCovb令,则上式为D(Y-bX)=)()],([)(2XDYXCovYD])()()],([1)[(2YDXDYXCovYD]1)[(2YD由于方差D(Y)是正的,故必有1-≥0,所以||≤1。2概率论()(),()()XEXYEYXYDXDY()()0,()()1EXEYDXDYcov(,)XYXY概率论()()()2cov(,)DXYDXDYXY222(1)0XYXY11XY概率论2.1存在常数a,b(b≠0),使P{Y=aX+b}=1,即X和Y以概率1线性相关.概率论考虑以X的线性函数b+aX来近似表示Y,以均方误差e=E{[Y-(b+aX)]2}来衡量以b+aX近似表示Y的好坏程度:e值越小表示b+aX与Y的近似程度越好.用微积分中求极值的方法,求出使e达到最小时的a,b相关系数刻划了X和Y间“线性相关”的程度.概率论=E(Y2)+a2E(X2)+b2-2aE(XY)+2abE(X)-2bE(Y)e=E{[Y-(b+aX)]2}222()2()02()2()2()0ebaEXEYbeaEXEXYbEXa0(,)()CovXYaDX解得00()()bEYaEX这样求出的最佳逼近为L(X)=b0+a0X概率论这样求出的最佳逼近为L(X)=b0+a0X这一逼近的剩余是若=0,Y与X无线性关系;Y与X有严格线性关系;,1若可见,若0||1,||的值越接近于1,Y与X的线性相关程度越高;||的值越接近于0,Y与X的线性相关程度越弱.E[(Y-L(X))2]=D(Y)(1-)2概率论3.X和Y独立时,=0,但其逆不真.由于当X和Y独立时,Cov(X,Y)=0.故)()(),(YDXDYXCov=00但由并不一定能推出X和Y独立.请看下例.概率论,Cov(X,Y)=0,例1设X服从(-1/2,1/2)内的均匀分布,而Y=cosX,不难求得概率论因而=0,即X和Y不相关.但Y与X有严格的函数关系,即X和Y不独立.概率论对二维随机变量(X,Y),有下列关系式:前面,我们已经看到:若X与Y独立,则X与Y不相关,但由X与Y不相关,不一定能推出X与Y独立.XY=0cov(,)0()()()()()()XYXYXYEXYEXEYDXYDXDY与相互独立与不相关概率论•但是对于正态分布,有下列等价关系若(X,Y)服从二维正态分布,则X与Y独立X与Y不相关概率论四、小结这一节我们介绍了协方差、相关系数、相关系数是刻划两个变量间线性相关程度的一个重要的数字特征.注意独立与不相关并不是等价的.当(X,Y)服从二维正态分布时,有X与Y独立X与Y不相关概率论五、布置作业习题四17,18
本文标题:概率4-3
链接地址:https://www.777doc.com/doc-5003104 .html