您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 二项分布中方差的计算
二项分布中方差的计算假设ξ~B(n,p),即knkknqpCkP}{考虑E[ξ(ξ-1)]=Eξ2-Eξ而nkknkknnkknknkknknkknkknqpCpnnqpknknnnqpknknkkqpCkkE22222220)1()]!2(2[)!2()!2()1()!(!!)1()1()]1([令2ki上式=222220222)1()1(nppnpnnqpCpnnniiniin即2222nppnEE,再将Eξ=np代入上式,得)1(222222pnppnnpnppnE最后得npqnppnppnEED22222)()1()(例1的分布图00.050.10.150.20.250.30.350.40123456P例2的分布图00.050.10.150.20.250.3012345678910P4.2超几何分布例1的图形:00.10.20.30.40.501234P例2的图形:00.10.20.30.40.50123P定义4.2设N个元素分为两类,有N1个属于第一类,N2个属于第二类(N1+N2=N).从中不重复抽样取n个,令ξ表示这n个中第一类元素的个数,则ξ的分布称为超几何分布,),....,1,0()(21nmCCCmPnNmnNmN规定:如nr,那末0rnC由概率分布的性质可知1)(0nmmP,即1021nmnNmnNmNCCC可得组合的性质nNNnkknNkNCCC21210计算ξ的数学期望和方差有两种方法第一种,按定义nmnNnmnNnmnNmnNmNnmmnNmnNmNmNCNmnNmnNmNmNmCCCCmmmPE1221111221100)!11()!11(!)!11()!1()!1()!()!(!)!(!!1)(21令k=m-1,则上式=npNNnnNnNnNnNNCCNCCCNnNnNnkknNkNnN1111110111)!()!1()!1()!(!!21其中NNp1为只抽一次抽到元素N1的概率因此放回抽样(二项分布)与不放回抽样(超几何分布)的数学期望是一样的.nmmnNmNnNnmmnNnNnmmnNnNnmnNmnNmNnmCCCNNCmNmNCNNCmNmNCCCCmmmPmmE2)2()2(22112111121120212221)1()!22()!2()!2()1()!()!2(!1)1()()1()]1([令k=m-2,上式=221120)2(211)1()1(21nNnNnkknNkNnNCCNNCCCNN)1()1()1()!()!2()!2()!(!!)1(1111NNnnNNnNnNnNnNNN因此NnNNNnnNNEEE1112)1()1()1()]1([11)1())(()1()]()([)1(][)1(][)1()]1()1()1)(1[()1()1()1()1()1()1()1()1()(21211211121211211211121112212111221211122NnNnpqNnNNNNNnNNnNNNnNNNNNnNNNnNNNnNNnNNNnNNNnNNnNNNNnNNNnNNnNNNNnNNNNnNnNNNNNnNNnNNnnNNNNnNnNNNnnNNEED其中q=1-p另有一种办法计算ξ的数学期望,假设ξi是第i次抽到第一类元素的个数,因为只是1次,当然不是1就是0,因此服从0-1分布,且有),...,2,1(,)0(,)1(21niqNNPpNNPii,则),...,2,1(1nipNNEi因此npNNnnEEEEEEinn12121)(整个方法同二项分布时的相应方法一样,只是各ξi间并非相互独立,但和的期望等于期望的和这条性质并不要求和中各项的随机变量相互独立。当N非常大时,远大于抽样数n时,记作Nn超几何分布可以用二项分布来近似。为说明这一点,首先给出一个近似式如下:当Nn时,有!nNCnnN这是因为)11()21)(11(!!)1()2)(1(NnNNnNnnNNNNCnnN当N很大时,后面每个括号的值近似为1,因此上面近似式成立,N越大越准确,当N趋于无穷时,约等于可以变为等于。而当超几何分布中总元素的个数N非常大时,Nn,在保持N1/N不变的情况下N1和N2也会很大,也有N1m,N2n-m,因此有mnmmnmnmnmnmnNmnNmNqpCNNNNmnmnnNmnNmNCCCmP2121)!(!!!)!(!)(21当N趋于无穷时,近似式就成为准确式。4.3普哇松分布普哇松分布的来源是这样,有时候要在一个单位长的时间段内进行大量的二项分布试验,但希望在这个单位长的时间段内事件A发生的平均数量为指定值λ,因此将单位长度的时间段平均划分为n段,在每一段做一次独立试验,使事件A发生的概率为p,而因为单位时间长度内,即n次试验中A平均要发生给定值λ次,而二项分布的均值已知为np,也就是满足λ=np,或者说在给定试验次数n和均值λ的情况下,p=λ/n那么,当n很大时,p必然很小,这时候的二项分布就很接近普哇松分布,当n趋向于无穷大时,必有p趋向于无穷小,即在每个无穷小的时间段内都做一次独立试验,事件A发生的概率也是无穷小,但积累起来,单位时间内A发生的平均数量还是λ.在推导时,要用到近似公式xxe)1(当x趋向于无穷小时等式严格成立.当给定λ=np,且n很大,p=λ/n很小时knkknqpCkP)(假设kn因此!knCkkn则eknnkpknpqpknkPnknkknkknkk!11!)1(!)(!)(因此我们有定义4.3如果随机变量ξ的概率密度函数是,...)1,0(!)()(memmPmPm其中λ0,则称ξ服从普哇松(Poisson)分布.利用级数0!kkxkxe可得1!)(00eeemmPmmm数学期望与方差的计算110)!1(!mmmmememmE令1mk则ekEkk0!当用普阿松分布来近似二项分布时,np,其数学期望与二项分布的数学期望是一致的。因为22202)!2(!)1()1(mmmmememmmEEE令k=m-2,则202!)]1([kkekE222EE最后得2222)(EED因此,普阿松分布的期望和方差都是λ,标准差为,这给统计带来方便。因为,通常情况下是知道一随机变量服从普阿松分布,但是未知参数是λ,此参数正好是数学期望,因此就统计一段时间,看单位时间内某事件出现的次数的平均值,即事件发生总数除以时间。得到的统计值λ就是单位时间内发生次数ξ服从的普阿松分布的参数。当用普阿松分布近似表示二项分布时,因为λ=np且n一定要很大,即p一定非常小,则二项分布的方差npq=np(1-p)≈np=λ,还是一致的。
本文标题:二项分布中方差的计算
链接地址:https://www.777doc.com/doc-2746925 .html