您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 5.2(中心极限定理)
5.2中心极限定理大数定律讨论的是多个随机变量的算术平均的渐近性质.现在我们来讨论独立随机变量和的极限分布.先给出一个例子.第5章大数定律和中心极限定理【例5-4】误差分析是人们经常遇到且感兴趣的随机变量,大量的研究表明,误差是由大量微小的相互独立的随机因素叠加而成的.现在考虑一位操作工在机床上加工机械轴,要求其直径应符合规定要求,但加工后的机械轴与规定要求总会有一定误差,这是因为在加工时受到一些随机因素的影响,它们是:(1)在机床方面有机床振动与转速的影响;(2)在刀具方面有装配与磨损的影响;5.2中心极限定理(3)在材料方面有钢材的成分、产地的影响;(4)在操作者方面有注意力集中程度、当天的情绪的影响;(5)在测量方面有度量工具误差、测量技术的影响;(6)在环境方面有车间温度、湿度、照明、工作电压的影响;(7)在具体场合还可列出许多其他影响因素.5.2中心极限定理由于这些因素很多,每个因素对加工精度的影响都是很微小的,而且每个因素的出现又都是人们无法控制的、随机的、时有时无、时正时负的.这些因素的综合影响最终使每个机械轴的直径产生误差,若将这个误差记为Yn,那么Yn是随机变量,且可以将Yn看作很多微小的随机波动X1,X2,…,Xn之和,即Yn=X1+X2+…+Xn,这里n是很大的,那么我们关心的是,当n→∞时,Yn的分布是什么?5.2中心极限定理当然,我们可以考虑用卷积公式去计算Yn的分布,但这样的计算是相当复杂的、不现实的,而且也是不易实现的.有时即使能写出Yn的分布,但由于其形式过于复杂而无法使用.本节研究在相当一般的条件下独立随机变量的和的分布收敛于正态分布的问题.5.2中心极限定理5.2.1独立同分布的中心极限定理定理5.5(独立同分布的中心极限定理)设X1,X2,…,Xn,…为相互独立、服从同一分布的随机变量序列,且D(Xi)=20(i=1,2,…),则对于任意x,有该定理我们通常称之为林德伯格-莱维(Lindeberg-Levy)定理,该定理是这两位学者在上世纪20年代证明的,这里证明从略.,)(iXE)(21lim212xΦdtexnnXPxtniin5.2中心极限定理(5.6)我们来看一下(5.6)式含义:若记记为Yn的分布函数,则(5.6)式可以写成这表明,当充分大时,Yn近似服从标准正态分布N(0,1),即从而当n充分大时,(5.7),1nnXYniin)(xFnY)()(limxΦxFnYn)1,0(~1NnnXnki近似),(~21nnNXnii近似5.2.1独立同分布的中心极限定理(5.7)(5.7)式说明,不论X1,X2,…,Xn服从什么分布,只要满足定理的条件,当n充分大时,就可以把作为正态随机变量处理,这在理论研究和实际计算上都非常重要.我们将上述结论稍作变形,还可以得到定理结论的另外表现形式.),(~21nnNXnii近似niiX15.2.1独立同分布的中心极限定理推论5.1设相互独立的随机变量X1,X2,…,Xn服从同一分布,其均值为,方差为20,则当n充分大时即(5.8)其中由推论可知,无论X1,X2,…,Xn是服从什么分布,其算术平均值当n充分大时总是近似地服从正态分布.这一结果是数理统计中大样本理论的基础.)1,0(~NnX近似),(~2nNX近似.11niiXnX5.2.1独立同分布的中心极限定理【例5.5】用机器包装味精,每袋净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精,求一箱味精净重大于20400克的概率.解:设箱中第i袋味精的净重为Xi克,是200个相互独立同分布的随机变量.且由定理5.5即,100)(,100)(iiXDXE200,,2,1i)100200,100200(~2001NXii近似)20000,20000(~2001NXii近似20021,,,XXX5.2.1独立同分布的中心极限定理所以)20000,20000(~2001NXii近似}20400{1}20400{20012001iiiiXPXP)83.2(1200002000020400200002000012001ΦXPii0023.09977.015.2.1独立同分布的中心极限定理5.2.2二项分布的正态近似现在将定理5.5应用于服从0-1分布的随机变量,即设X1,X2,…,Xn,…相互独立,且都服从参数为的0-1分布:P{Xi=k}=pk(1–p)1-k,k=0,1;i=1,2,…此时,又记,则n~B(n,p).此时定理5.5的结论可写成),2,1(),1()(,)(ippXDpXEiiniinX1)(21)1(lim22xΦdtexppnnpPxtnn于是,有下述定理:定理5.6(棣莫弗—拉普拉斯定理)设n(n=1,2,…)服从参数为n,p(0p1)的二项分布,则对于任意实数x,有这个定理表明,当n充分大时,服从二项分布的随机变量n的标准化变量近似服从标准正态分布.即有)(21)1(lim22xΦdtexpnpnpPxtnn)1,0(~)1(Npnpnpn近似5.2.2二项分布的正态近似从而即当n充分大时,服从二项分布的随机变量n近似服从正态分布.))1(,(~pnpnpNn近似5.2.2二项分布的正态近似一般来说,当n较大时,二项分布的概率计算起来非常复杂,这时我们就可以用正态分布来近似二项分布,使概率计算得到简化.即对于任意正数n1和n2,有}{)1(2121nnknknkknnnPppC))1(())1((12pnpnpnpnpnpn})1()1()1({21pnpnpnpnpnppnpnpnPn5.2.2二项分布的正态近似(5.10)【例5.6】设电路供电网内有10000盏相同的灯,夜间每一盏灯开着的概率为0.8,假设各灯的开关彼此独立,计算同时开着的灯数在7800与8200之间的概率.解:记同时开着的灯数为X,它服从二项分布B(10000,0.8),于是由定理5.6,有}82007800{XP11)5(21)4.02(2)2.08.01000080007800()2.08.01000080008200(ΦΦ5.2.2二项分布的正态近似【例5.7】某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的,问总机需备多少条外线才能以95%的概率满足每个分机在用外线时不用等候?解:设表示同时使用外线的分机数,则~B(260,p),其中p=0.04.根据题意应确定最小的使成立.由定理5.6,有%95}{xP))1(260260()1(260260)1(260260}{pppxΦpppxpppPxP5.2.2二项分布的正态近似令查得故取于是也就是说,至少需要16条外线才能95%满足每个分机在用外线时不用等候.%95))1(260260(pppxΦ95.09505.0)65.1(65.1)1(260260pppxpppx260)1(26065.161.1504.026096.004.026065.15.2.2二项分布的正态近似【吸烟率调查问题解答】某卫生组织为确定某城市成年男子的吸烟率p,将被调查的成年男子中吸烟的频率作为p的估计,现在要保证有90%以上的把握,使得调查对象吸烟者的频率与该城市成年男子的吸烟率p之间的差异不大于5%,问至少要调查多少对象?解:设共调查n个成年男子,记则Xi独立同分布,且又记n个调查对象中,吸烟的人数为X,则有.,2,10,1niiiXi个成年男子不吸烟,第,个成年男子吸烟,第由大数定理知,当n很大时,频率X/n与概率p很接近,可用X/n作为p的估计.依题意要保证P{|X/n–p|0.05}0.90,即也即查表得),(~1pnBXXnii90.01)1(05.02ppn95.0)1(05.0ppn95.0)645.1(nnpXPpXnPniinii05.005.0111【吸烟率调查问题解答】所以从而又因为所以即至少要调查271个成年男子.645.1)1(05.0ppn41.1082)1(05.0645.1)1(22ppppn25.0)1(pp6.270n【吸烟率调查问题解答】
本文标题:5.2(中心极限定理)
链接地址:https://www.777doc.com/doc-3175162 .html