您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 4.3(协方差及相关系数、矩)
4.3协方差及相关系数、矩对于二维随机变量(X,Y),除了讨论X与Y的数学期望和方差外,还需讨论描述X与Y之间相互关系的数字特征:协方差和相关系数.4.3.1协方差由4.2.2中方差的性质(3)知,若随机变量X与Y相互独立,则D(X+Y)=D(X)+D(Y),也就是说,当随机变量X与Y相互独立时,有E{[X–E(X)][Y–E(Y)]}=0成立,这意味着当E{[X–E(X)][Y–E(Y)]}0时,X与Y不相互独立,由此可见这个量的重要性.4.3.1协方差定义4.4设有二维随机变量(X,Y),如果E{[X–E(X)][Y–E(Y)]}存在,则称其为随机变量X与Y的协方差.记为Cov(X,Y),即Cov(X,Y)=E{[X–E(X)][Y–E(Y)]}这样,上节中方差的性质(3)可改写为D(X+Y)=D(X)+D(Y)+2Cov(X,Y)由(4.9)式及(4.10)式知协方差的表达式可以表示为Cov(X,Y)=E(XY)–E(X)E(Y)常利用这个式子来计算协方差Cov(X,Y).4.3.1协方差由协方差定义,不难知道协方差还具有以下几条性质:(1)(2)(3),a,b为常数;(4)(5)当随机变量X与Y相互独立时,有Cov(X,Y)=0.);,(),(XYCovYXCov);(),(XDXXCov),(),(YXabCovbYaXCov);,(),(),(2121YXCovYXCovYXXCov4.3.1协方差【例4.22】设随机变量(X,Y)具有概率密度其中区域G由曲线与围成,如图4-4所示,求Cov(X,Y)及D(X+Y).解:其它,0),(,3),(Gyxyxf)(XE,20/93)(102xxydydxYE,4/13)(102xxxydydxXYE,35/93)(10222xxdydxxXE,35/93)(10222xxdydxyYE,2800/153)20/9(35/9)]([)()(222XEXEXD,20/91023xxxdydx4.3.1协方差,2800/153)()(XDYD,400/19)()()(),(YEXEXYEYXCov.700/143),(2)()()(YXCovYDXDYXD§4.3协方差及相关系数、矩4.3.2相关系数定义4.5称为随机变量X与Y的相关系数.相关系数XY是一个无量纲的量.XY常简记为.)()(),(YDXDYXCovXY)0)(,0)((YDXD【例4.23】在例4-22中,求相关系数XY.解:因为所以87.01531332800/153400/19)()(),(YDXDYXCovXY,400/19)()()(),(YEXEXYEYXCov4.3.2相关系数,2800/153)()(XDYD4.3.2相关系数下面不加证明地给出相关系数的两条性质:(1)|XY|1;(2)|XY|=1的充要条件是,存在常数a,b,使P{Y=aX+b}=1.定义4.6若XY=0,称X与Y不相关.0XY1,称X与Y正相关,–1XY0,称X与Y负相关.事实上,相关系数XY是X与Y线性关系强弱的一个度量,X与Y的线性关系程度随着|XY|的减小而减弱,当|XY|=1时X与Y的线性关系最强,当XY=0时,意味X与Y的不存在线性关系,即X与Y不相关.4.3.2相关系数由协方差的性质(5)当随机变量X与Y相互独立时,有Cov(X,Y)=0.易知定理4.3若X与Y相互独立,则XY=0,即X与Y不相关,反之不真.这意味着,X与Y不相关仅指X与Y之间不存在线性关系,并不能说明X与Y不具有其他关系.4.3.2相关系数【例4.24】设随机变量Z服从(–,)上的均匀分布,又X=sinZ,Y=cosZ,试求相关系数XY.解:由于因而Cov(X,Y)=0,XY=0.相关系数XY=0,说明随机变量X与Y不相关,但是,由于,所以X与Y不独立.,0sin21)(zdzXE0cossin21)(zdzzXYE,0cos21)(zdzYE122YX4.3.3矩矩的概念在后面的数理统计部分有重要应用.定义4.7设X和Y是随机变量,若E(Xk),k=1,2,…存在,称其为X的k阶原点矩,简称k阶矩;若存在,称其为X的k阶中心矩;若存在,称其为X和Y的k+l阶混合矩;若存在,称它为X和Y的k+l阶混合中心矩.,2,1},)]({[kXEXEk,2,1,),(lkYXElk,2,1,},)]([)]({[lkYEYXEXElk4.3.3矩(1)X的k阶原点矩:E(Xk),k=1,2,…(2)X的k阶中心矩:(3)X和Y的k+l阶混合矩:(4)X和Y的k+l阶混合中心矩:显然,X的数学期望E(X)是X的一阶原点矩,X的方差D(X)是X的二阶中心矩,X和Y的协方差Cov(X,Y)=0是X和Y的二阶混合中心矩.,2,1},)]({[kXEXEk,2,1,),(lkYXElk,2,1,},)]([)]({[lkYEYXEXElk【实验4-2】设X和Y分别表示在一分钟内通过某收费站的小汽车数量和卡车数量,X和Y的联合分布律如下:(1)期望E(X)、E(Y)、E(XY)(2)方差D(X)、D(Y)(3)协方差Cov(X,Y)(4)相关系数XYYX0123400.050.040.010010.050.10.030.02020.030.050.150.050.02300.020.080.10.054000.020.050.08实验准备:(1)函数SUMPRODUCT的使用格式:SUMPRODUCT(array1,array2,array3,...)功能:返回多个区域array1,array2,array3,...对应数值乘积之和.(2)函数MMULT的使用格式:MMULT(array1,array2)功能:返回两数组的矩阵乘积.结果矩阵的行数与array1的行数相同,列数与array2的列数相同.实验步骤:(1)整理数据如图4-5所示.图4-5整理数据(2)计算边缘概率P{X=xi}和P{Y=yj}在单元格G2中输入公式:=SUM(B2:F2),并将其复制到单元格区域G3:G6在单元格B7中输入公式:=SUM(B2:B6),并将其复制到单元格区域C7:F7(3)计算期望E(XY)首先在单元格B9中输入公式:=MMULT(B1:F1,B2:F6),选中单元格区域B9:F9后,按F2键,再按组合键Ctrl+Shift+Enter,算出中间数组,如图4-6所示.图4-6计算矩阵乘积然后在单元格B10中输入公式:=MMULT(B9:F9,A2:A6),即得期望E(XY),如图4-7所示.图4-7计算期望E(XY)(4)计算期望E(X)、E(Y)和方差D(X)、D(Y)在单元格B11中输入公式:=SUMPRODUCT(G2:G6,A2:A6)在单元格B12中输入公式:=SUMPRODUCT(B1:F1,B7:F7)在单元格D11中输入公式:=SUMPRODUCT(A2:A6,A2:A6,G2:G6)-B11^2在单元格D12中输入公式:=SUMPRODUCT(B1:F1,B1:F1,B7:F7)-B12^2(5)计算协方差Cov(X,Y)在单元格B14中输入公式:=B10-B11*B12(6)计算相关系数XY在单元格B15中输入公式:=B14/SQRT(D11*D12)即得结果如图4-8所示.图4-8计算结果第四章随机变量的数字特征【分赌本问题解答】1654年法国有个职业赌徒DeMeré向数学家Pascal提出了一个使他苦恼了很久的问题:甲乙两人各出赌注50法郎赌博,约定谁先赢3局,就赢得全部的100法郎,假定两人赌技相当,且每局无平局.如果当甲赢了两局,乙赢了一局时,因故要中止赌局,问如何分100法郎的赌注才算公平?这个问题在当时引起了许多人的兴趣,显然平均分对甲不公平,全部归甲对乙又不公平.合理的分法当然是按照一定的比例,甲多分些,乙少分些,那么如何确定分配比例呢?1654年法国有个职业赌徒DeMeré向数学家Pascal提出了一个使他苦恼了很久的问题:甲乙两人各出赌注50法郎赌博,约定谁先赢3局,就赢得全部的100法郎,假定两人赌技相当,且每局无平局.如果当甲赢了两局,乙赢了一局时,因故要中止赌局,问如何分100法郎的赌注才算公平?分法(1):基于已赌的局数分配:甲赢了两局,乙赢了一局,故甲乙两人按2:1的比例分赌注;【分赌本问题解答】【分赌本问题解答】分法(2):Pascal提出了如下的分法:设想再赌下去,甲的最终所得视为一个随机变量X,其可能值为0或100,再赌两局赌博必结束,结果无外乎是以下4种情形之一:甲甲、甲乙、乙甲、乙乙,其中“甲乙”表示甲胜第一局乙胜第二局,其余类似.由于赌技相同,所以甲在三种情形下可赢得100法郎,只在一种情形(乙乙)下,赢得0法郎.所以X的分布律如下:【分赌本问题解答】X的分布律如下:因此,Pascal认为,甲的“期望”所得应为(法郎)这种分法不仅考虑了已赌局数,而且还包含了对继续赌下去的一种“期望”,它比第一种分法更合理.这其实也正是数学期望这个名称的由来.7543100410)(XEX0100pi1/43/4
本文标题:4.3(协方差及相关系数、矩)
链接地址:https://www.777doc.com/doc-3215692 .html