您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 4.3 协方差和相关系数及矩-1
一、协方差及其性质第三节协方差、相关系数及矩二、相关系数及其性质三、矩特征中,最重要的就是本讲要讨论的协方差和相关系数前面我们介绍了随机变量的数学期望和方差,数学期望反映了随机变量在概率意义下的平均值,方差则反映了随机变量相对于其均值的离散程度,这对我们了解随机变量有一定的帮助,YX,随机变量,但对于二维YX,我们除了关心的期望和方差外,还希望知道他们的关系,在反映分量之间关系的数字在讨论这个问题之前,我们先看一个例子。在研究子女与父母的相象程度时,有一项是关于父亲的身高和其成年儿子身高的关系.收集了1078个父亲及其成年儿子身高的数据,画出了这里有两个变量:一个是父亲的身高,一个是成年儿子身高.为了研究二者关系.英国统计学家皮尔逊一张散点图.从图上看出:父亲及其成年儿子身高有关系,但没有明确的函数关系.类似的问题有:受教育程度和收入有什么关系?高考入学分数和大学学习成绩有什么关系?需要给出度量两变量的相互关系的指标.为了研究诸如此类的两变量的相互关系问题,E{[X-E(X)][Y-E(Y)]}=E(XY)-E(X)E(Y)若X,Y相互独立,则E{[X-E(X)][Y-E(Y)]}=0若X,Y不相互独立,则E{[X-E(X)][Y-E(Y)]}不一定等于零于是E{[X-E(X)][Y-E(Y)]}在一定程度上反映了X与Y的关系,称之为X与Y的协方差一协方差的定义1、定义:若E{[X-E(X)][Y-E(Y)]}存在,称E{[X-E(X)][Y-E(Y)]}为随机变量X,Y的协方差.2()()()()[]DXEXEXEXEXXEX2()()()()[]DXEXEYEYEYYEY即Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}记做Cov(X,Y)大家由此体会协方差Covariance的由来Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}(1).D(X)=cov(X,X);(2).D(X士Y)=D(X)+D(Y)士2Cov(X,Y)D(X+Y)=E{[(X+Y)-E(X+Y)]2}=D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]}说明1.Cov(X,Y)=Cov(Y,X);2.Cov(aX,bY)=abCov(X,Y),a,b是常数;3.Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y).二、协方差的性质问题:Cov(X,C)=?Cov(X,Y)=E(XY)-E(X)E(Y)证明:由协方差的定义及期望的性质,可得Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)=E(XY)-E(X)E(Y)即Cov(X,Y)=E(XY)-E(X)E(Y)三.计算公式:若X1,X2,…,Xn两两独立,,上式化为D(X+Y)=D(X)+D(Y)+2Cov(X,Y)niniiiXDXD11)()(常用上式计算相依随机变量和的方差.四方差与协方差的关系思考题Y=5X+6D(X)=3Cov(X,Y)=?Cov(X,Y)=Cov(X,5X+6)=5Cov(X,X)=15(X,Y)在以原点为圆心的单位圆内服从均匀分布故Cov(X,Y)=E(XY)-E(X)E(Y)=E(XY)求Cov(X,Y).解因例1可以证明X,Y不独立相互独立同分布,且其方差为,令计算协方差解例2设随机变量但它还受X与Y本身度量单位的影响.Cov(kX,kY)=k2Cov(X,Y)为了克服这一缺点,对协方差进行标准化:)()()]}()][({[)()(),(YDXDYEYXEXEYDXDYXCov这就引入了相关系数.协方差的大小在一定程度上反映了X和Y相互间的关系,例如:为随机变量X和Y的相关系数.定义:设D(X)0,D(Y)0,)()(),(YDXDYXCovXY称在不致引起混淆时,记为.XY相关系数及其性质已知二维随机变量的联合分布列为求:,0.300.120.180.100.180.12-11-201YX例3解边缘分布律为XY与的协方差为:0.300.120.180.100.180.12-11-201YX下面求的方差:YX,XY与的相互关系数为:2[(())]eEYabX2222()()2()2()2()EYbEXabEXYabEXaEY为使e取得最小值,令22()2()0eabEXEYa22()2()2()0ebEXEXYaEXb解得0C(,),()ovXYbDX0ov(,)()()()CXYaEYEXDX考虑用X的线性函数a+bX近似的表示Y00,ab将代入得2200min{[()]}{[()]}EYabXEYabX2(1)()XYDY01||1XY定理02||1,XY的充要条件是存在常数a,b,使{}1PYabX即X和Y以概率1线性相关.若随机变量X与Y相互独立,则X与Y不相关,(X,Y)~N(μ1,σ21;μ2,σ22;ρ),则X,Y相互独立ρ=0.此定理的逆定理不成立,即由ρXY=0不能得到X与Y相互独立.(见下面的例题)但是,对于二维正态分布,则有定理XY=0即有设X服从(-1/2,1/2)内的均匀分布,而Y=cosX,因而=0,即X和Y不相关.但Y与X有严格的函数关系,即X和Y不独立.Cov(X,Y)=0例4cov(,)cov(,cosX)XYX(cos)()(cosX)EXXEXE1212cos.1.0xxdx0EX=0E(XY)=0Cov(X,Y)=0X,Y具有明显的函数关系,只是没有线性关系例题5X-2-112140¼¼0¼001/4Y相关系数是衡量两个随机变量之间线性相关程度的数字特征.定义设随机变量X,Y的相关系数存在,2)ρXY=-1,称X,Y负相关;1)ρXY=1,称X,Y正相关;3)ρXY=0,称X,Y不相关.注ρXY=0仅说明X,Y之间没有线性关系,但可以有其他非线性关系.例7、~(),~(),XNYN22设1,30,4(1)求E(Z)和D(Z)(2)求ρXZ解:所以D(Z)=3=0定义设X为随机变量,若E(|X|k)+∞,称定义设X为随机变量,若E[|X-E(X)|k]+∞,四.矩γk=E(Xk)k=1,2,3…..为X的k阶原点矩.称μk=E{[X-E(X)]k}k=1,2,3…..为X的k阶中心矩.称βk=E[|X-E(X)|k]k=1,2,3…..为X的k阶绝对中心矩.设n维随机变量(X1,X2,…,Xn)的协方差均存在,称矩阵为(X1,X2,…,Xn)的协方差矩阵.Cij=cov(Xi,Xj)定义其中cov(X,Y)=E{[X-E(X)][Y-E(Y)]}D(X)=cov(X,X)3)C是非负定矩阵;对称阵三、协方差矩阵的性质例题10XYXY4-3c=X,Y-39设随机变量,的协方差矩阵为求的相关系数作业p1143,4P1181,34,6
本文标题:4.3 协方差和相关系数及矩-1
链接地址:https://www.777doc.com/doc-3172812 .html