您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第4章--大数定律和中心极限定理
第4章大数定理和中心极限定理4.1验证性实验4.2设计性实验4.3综合性实验第4章大数定理和中心极限定理•从17世纪概率论产生开始,随着18、19世纪科学的发展,人们注意到在某些生物、物理和社会现象与赌博游戏之间有某种相似性,从而由赌博起源的概率论被应用到这些领域中,这同时也大大推动了概率论本身的发展。•使概率论成为数学的一个分支的奠基人是瑞士数学家j.伯努利,他建立了概率论中第一个极限定理,即伯努利大数定律,阐明了事件的频率稳定于它的概率。随后棣莫弗和拉普拉斯又导出了第二个基本极限定理(中心极限定理)的原始形式。•拉普拉斯在系统总结前人工作的基础上写出了《分析的概率理论》,明确给出了概率的古典定义,并在概率论中引入了更有力的分析工具,将概率论推向一个新的发展阶段。•19世纪末,俄国数学家切比雪夫、马尔可夫、李亚普诺夫等人用分析方法建立了大数定律及中心极限定理的一般形式,科学地解释了为什么实际中遇到的许多随机变量近似服从正态分布。•算术平均值,即若干个数X1、X2……Xn之和除以n,是最常用的一种统计方法,人们经常使用并深信不疑。但其理论根据何在,并不易讲清楚,这是大数定律要回答的问题,在某种程度上可以说,大数定律是整个概率论最基本的规律之一,也是数理统计学的理论基石。•大数定律从理论上回答了通过试验来确定概率的方法:做n次独立的重复试验,以表示n次试验中事件A发生的次数,那么我们可以以很大的概率确信。nnpn•在客观实际中有许多随机变量,他们是由大量相互独立的随机因素的综合影响所形成的,其中每一个别因素在总的影响中所起的作用都很微小。如测量误差就可以看成是由很多微小的因素影响的结果叠加而成的。•这些因素相互独立地对测量结果发生影响,每个因素都只发生很微小的作用,把它们的影响叠加起来就造成了误差,类似这样的情况可以举出很多,而在某种具体条件下,这种随机变量往往近似的服从正态分布。•这种现象就是中心极限定理的客观背景。中心极限定理是概率论中论证随机变量和的极限分布为正态分布的定理的总称,也是大样本统计推断的理论基础。4.1验证性实验实验一大数定律•【实验目的】•1.加深对大数定理的认识,对其背景和应用有直观的理解•2.了解MATLAB软件在模拟仿真中的应用•【实验要求】大数定理的理论知识,Matlab软件•【实验内容】•1.设随机变量相互独立且服从参数为3的泊松分布。验证当时,随机变量依概率收敛到12。,,,,21nXXXnniinXnY121•2.已知每毫升正常成年男子的血液中,白细胞数的平均值是7300个,均方差是700,利用切比雪夫不等式估计成年男子每毫升血液中,白细胞数在5200~9400之间的概率。•【实验过程】•1.由随机变量的独立性关系,满足辛钦大数定律的条件,且各自的数学期望•所以,根据辛钦大数定律有:依概率收敛到。•可由Matlab生成一串满足泊松分布的随机数,,,,22221nXXX133)]([)()(222iiiXEXDXEniinXnY12112)(2iXE计算,求它的期望是否接近12.给n一系列逐渐增大的取值,观察接近的情况,,,,21nXXXniinXnY121•在命令窗口输入:•n=[100500100030005000];•k=1000;•Ey=[];•forjj=1:size(n,2)•X=[];Y=[];•forii=1:n(jj)•X(:,ii)=poissrnd(3,k,1);•end•Y(:,jj)=sum(X(:,1:n(jj)).^2,2);•Ey(jj)=mean(Y(:,jj))/n(jj);•end•Ey•依次给n赋值100500100030005000,输出结果为:•Ey=•12.028612.012512.012911.997412.0059•可以通过画出Ey的图形来观察它的变化情况:•2.设每毫升血液含有的白细胞数为,所求为。显然,不知道X的分布情况不能直接求出此概率值。•但是,已知,,所以,由切比雪夫不等式,}94005200{XP7300)(XE2700)(XD8889.021007001}21007300{}73009400730073005200{}94005200{22XPXPXP•所以,大约88.89%以上的成年男子每毫升血液中的白细胞数在5200~9400之间。•实验过程为,在Matlab命令窗口输入:•Ex=7300;•Dx=700;•p=1-Dx^2/(9400-Ex)^2•输出结果为:•p=•0.8889•实验二中心极限定理•【实验目的】•1.加深对中心极限定理的认识,对其背景和应用有直观的理解•2.了解MATLAB软件在模拟仿真中的应用•【实验要求】数学中心极限定理的理论知识,Matlab软件•【实验内容】•1.一个加法器同时收到20个噪声电压,•.设他们是相互独立的随机变量,且都服从[0,10]上的均匀分布。记,求的近似值。kV20,,2,1k201iiVV)105(VP•2.据说公共汽车车门的高度是按成年男子与车门碰头的机会在0.01以下的标准来设计的。根据统计资料,成年男子的身高X服从正态分布(厘米),那么车门的高度应该是多少厘米?)7,168(2N•【实验过程】•1.根据理论计算,易知,,•,•近似服从正态分布5kEV12100kDV20,,2,1k35101001210020520VV)1,0(N•所以•可以通过Matlab验证,随机生成20个在[0,10]上的均匀分布的噪声数据,计算它们的和。重复多次,计算它们的和大于105的概率。3483.0)387.0(1)387.0(351053510100)105(PPVPVP•在Matlab命令窗口输入:•times=1000;•R=unifrnd(0,10,20,times);•sigma=sum(R);•pro=sum(sigma105)/times•结果为:•pro=•0.3510•2.根据理论,设车门高度为,那么应有:•由,有:a01.0)(aXp)7,168(~2NX01.0)7168(1)71687168(1)(1)(aaXpaXPaXp•有:•所以•得(cm)•有Matlab命令:h=norminv(0.99,168,7)•得到:184.2844•用Matlab模拟,随机生成正态分布的随机数•,计算它们大于184.31的概率.如果小于0.01,则说明184.31符合要求。99.0)7168(a33.27168a3.18433.27168a)7,168(~2NX•在Matlab命令窗口输入:•times=1000;•R=normrnd(168,7,times,1);•pro=sum(R184.31)/times•结果为:•pro=•0.0090•说明一个人大于184.31cm的为0.0090,符合小于0.01的要求。4.2设计性实验•实验一大数定律•【实验目的】•1.加深对大数定理的认识,对其背景和应用有直观的理解•2.了解MATLAB软件在模拟仿真中的应用•【实验要求】数学期望与方差的理论知识,Matlab软件•【实验内容】•用蒙特卡罗方法计算定积分,如•。•【实验方案】•通过概率论的想法实现数值计算的方法叫做蒙特卡罗方法,其理论根据之一就是大数定律。定积分的计算可以用如下方法实现。badxxfI)(dxxI102•任取一列相互独立的随机变量,它们都服从上的均匀分布,则也是一列相互独立的随机变量,且}{i],[ba)}({ifabIdxxfabfEbai)(1)]([•所以•而由大数定律,有•因此只要能生成随机变量序列,就能求出的近似值。)]([)(ifEabI)]([)()()(21ipnfEnfff•我们可以在计算机上先生成服从均匀分布的随机数,然后通过上面公式得出近似值,即:•这里的是计算机上生成的随机数。}{i)]()()([21nfffnabIn,,,21•【实验过程】•假设生成1000个随机数进行近似计算,在命令窗口输入:•times=1000;•x=rand(1,times);•y=x.^2;•I=sum(y)/times•I=•0.3422•而直接根据积分公式计算,我们有结果:•syms('x');•I=int(x^2,0,1)•I=•1/3•可见,概率积分方法与实际结果非常近似•实验二中心极限定理•【实验目的】•1.加深对中心极限定理的认识,对其背景和应用有直观的理解•2.了解MATLAB软件在模拟仿真中的应用•【实验要求】数学中心极限定理的理论知识,Matlab软件•【实验内容】•1.根据蒙德尔遗传理论,红、黄两种番茄杂交第二代红果植株和黄果植株的比率为3:1。现在种植杂交种400株,试求黄果植株介于83和117只间的概率。•2.已知一本380页的书中每页的印制错误的个数服从泊松分布,求这本书的印刷错误总数不多于60个的概率。)15.0(•3.设有3000个同一年龄段和同一社会阶层的人参加了保险公司的保险。统计资料表明:在一年中这一年龄段的人死亡的概率为0.003。每个人在年初向保险公司缴纳保费280元,而在死亡时家属可从保险公司领到50000元。求:•(1)保险公司亏本的概率;•(2)保险公司获利不少于20万元的概率。•故所求概率为0.95。95.01975.021)96.1(2)96.1()96.1()43414004140083()434140041400117()11783(400P•在Matlab命令窗口输入:•n=400;•p=1/4;•u1=117;•Pu1=normcdf((u1-n*p)/sqrt(n*p*(1-p)));•u2=83;•Pu2=normcdf((u2-n*p)/sqrt(n*p*(1-p)));•Pu=Pu1-Pu2•输出结果为:•Pu=•0.9504•2.以表示第i页印刷错误的个数,,则该书的印刷错误总数为•由题意,,则,且•相互独立。所以,由独立同分布的中心极限定理iX380,,2,1i3801iiXX)15.0(~iX15.0)(,15.0)(iiXDXE38021,,XXX6544.0)397.0()575760(}15.038015.03806015.038015.0380{}60{XPXP•在Matlab命令窗口输入:•lamda=0.15;•n=380;•x=60;•Px=normcdf((x-n*lamda)/sqrt(n*lamda))•输出结果为:•Px=•0.6544•3.设X表示一年里3000投保人中的死亡人数,则,年初保险公司的收入为280*3000=840000元,赔付金额为50000X元。•(1)保险公司亏本的情况为:)003.0,3000(~bX050000840000X•则由棣莫弗-拉普拉斯中心极限定理,•所以,保险公司亏本的概率为0.0047。0046.09954.01)6039.2(1)997.0003.03000003.030008.16(1}8.16{1}8.16{}050000840000{XPXPXP•(2)保险公司获利20万元的概率为:•即保险公司获利不少于20万元的概率为0.8977。8977.0)2686.1()997.0003.03000003.030008.12(}8.12{}20000050000840000{XPXP•【实验过程】•观察400株杂交种每株
本文标题:第4章--大数定律和中心极限定理
链接地址:https://www.777doc.com/doc-5488421 .html