您好,欢迎访问三七文档
当前位置:首页 > 高等教育 > 理学 > 粒子物理与核物理实验中的数据分析-第3讲-常用概率密度函数
10/03/2009110/03/20091粒子物理与核物理实验中的数据分析陈少敏清华大学第三讲:常用概率密度函数10/03/2009210/03/20092本讲要点常用的概率密度函数分布的数学形式相应的平均值与方差相关的应用范围10/03/2009310/03/20093二项式分布N次独立测量,每次只有成功(概率始终为p)或失败(概率为1-p)两种可能,得到n次成功的概率为!(;,)(1)!()!nNnNfnNpppnNn:[]EnnfNp平均值2222:[][()][][](1)VnEnEnEnNpp方差适用于仪器探测效率误差的计算可以证明其满足归一化条件!(1)!()![(1)]1nNnnNNppnNnpp10/03/20094二项式分布均值证明10/03/200940![](1)!()!NnNnrNEnnfnppnNn1!(1)!nnn11(1)!(1)(1)!()!NnNnnNNpppnNn!(1)!NNN0(1)!(1)(1)!()!NnNnnNNpppNpfNpnNn1,1nnNN关键点:均值计算要求N趋于无穷大。10/03/20095二项式分布的适用条件10/03/200951.每次尝试仅有两种可能性;2.每次尝试的成功概率是一样的;3.不同次尝试的的结果是独立的。伯努利试验考虑驾车人被停车检查有否不佩戴安全带的情况是否为一个伯努利试验。两种结果:佩戴与不佩戴!如果对所有车都一样,那么驾车人都有同样的概率不佩戴安全带!?(不同年龄人群都是一样的吗?)检查不同驾车人都佩戴安全带,结果应该是独立的!?(对于同时同地的前后驾车人都是一样的吗?)因此,根据数据采样情况,才能分清是否为伯努利试验,才能决定能否应用二项式分布。10/03/2009610/03/20096举例:在效率误差估计中的应用多层阻性板室(MRPC)的探测效率闪烁体1MRPC宇宙线闪烁体2闪烁体1与2同时击中给出穿过MRPC的粒子数NMRPC记录的击中数目N’MRPC探测效率测量值及其误差(1)NpNNpppNN10/03/20097二项式分布指导决策10/03/20097我们为大亚湾实验研制生产触发电子学版。按设计在一年内需要修理的电路板为10%。如果在实验所需的20块板中有5块在第一年使用时需要进行维修,那么这种故障率是否可以接受?解答:首先找出在一年内20块板中有5块或更多出现问题需要进行维修的概率204504200(;20,0.1)1(;20,0.1)20!10.1(10.1)!(20)!10.95680.0432nnnnnfnfnnn允许有5块以上有故障的概率非常小,故板的质量不能接受。10/03/2009810/03/20098从二项式到多项式分布类似于二项式分布,但允许结果的可能性m大于两种,概率为1)...,,(121miimppppp尝试N次,结果为可能性1:n1可能性2:n2…),...,,(21mnnnn得到(n1,n2,…,nm)概率为321...!!...!!)(2121nmnnmpppnnnNnfiiNpnE][:平均值)1(][:iiipNpnV方差)(:jipNpVjiij协方差适用于直方图频数误差估计。10/03/2009910/03/20099泊松分布泊松分布是二项式分布在N,p0和Np=常数的极限形式。!(;)nnfne:[]Ennf平均值2222:[][()][][]VnEnEnEn方差著名的统计误差估计式nn10/03/200910泊松分布式是二项式分布的近似10/03/200910概率的第三公理:如果A1,A2,A3,…是在空间S中互斥事例一个有限或无限的序列,则123123(...)()()()...PAAAPAPAPA001()!!nnxnneeeeenn函数为的麦克劳林公式-!(;,)1!()!(1)(2)...(112)11(1)(1)...!!1)1-(nNnNnnnnnNNnfnNnNnNNNNNNnnnNNnNNNnN12111...11NnNNN/11[11(1)]limNxNxnNnNxNeN10/03/20091110/03/200911举例:光电倍增管暗电流影响在有11146根PMT的探测器中,已知每根PMT暗电流产生的误响应为3.5kHz。求探测器在任意总长度为500s时间段观察到每隔10nsPMT误击中数目分别为5和6的总次数)次(2.0!64.01056)次(3!54.010554.0644.054ee在10ns间隔观测到PMT误击中的平均数目为8101114635000.4500s平均数日本超级神冈中微子探测器这一结论影响到我们在数据分析中应采取的对策。10/03/20091210/03/200912二项式分布与泊松分布假设一学生站在路边想搭便车。过路的汽车平均频率为每分钟一辆,服从泊松分布。而每辆车让搭便车的概率为1%,计算该学生在过了60辆车以后还未能搭上车的可能性N=60,p=0.01,r=05472.0)01.01(01.0)!060(!0!60:0600根据二项式分布5488.0!0)01.060(:001.060e根据泊松分布泊松分布是二项式分布的近似。特点:N大p小10/03/20091310/03/200913泊松分布是二项式分布的近似例如:对于以平均值为2的泊松分布而言,相当于二项式分布中的Np=2。当N值增大时,为了保持Np不变,p值相应减小。可以从右图看出,当N大于50时,两种分布的区别几乎可以忽略。rsuccesses(orfailures)ProbabilityN=10N=20N=50N=100泊松分布10/03/20091410/03/200914直方图中的误差处理观测量频数一个直方图可看成与1.一个事例总数满足泊松分布和在每个区间得到n1,n2,n3…事例数为多项式分布有关;2.或者是直方图中每个区间互相独立的泊松分布有关。总数N各区间频数n1,n2,n3…2222123123()()()()......NNNnnnnnnN或每个格子的误差为in注意:当N5时误差估计会有很大的偏差。10/03/200915分数电荷夸克的寻找实验原理:当高速带电粒子穿过云室时,所产生的电离会引起液滴的形成,它们在云室中形成可以观测的径迹。假设每单位径迹形成一粒液滴的概率是常数,并且正比于粒子电荷的开方。由于几乎所有粒子穿过云室时都带一个电荷单位,可以通过寻找一个径迹引起的单位液滴数目,明显比所有径迹的平均值要低的粒子的存在证据,来从实验上确立“夸克”这种理论上认为只带2/3单个(质子)电荷的存在证据。10/03/200916泊松分布诠释从假设中得知,径迹在一个给定长度中的液滴数目应该服从泊松分布。通过对正常径迹在固定长度引起的液滴数目进行测量得到均值为229。在同样长度下,对55,000根径迹进行测量,发现有一根径迹只产生110个液滴。出现该情况的正常概率为:229110180229(110)1.610!iiefni结果比频率概率相差很大,出现显著的反常(即:不可能出现只含110液滴的径迹)。5121055,000频率概率泊松统计(主观概率)重新研究发现泊松分布的现象与粒子的散射有关。10/03/200917新物理+泊松分布的诠释假设每个“泊松”事例精确产生4个液滴,原来实验观察到的平均液滴数应是4的倍数,也就是44110221128922的倍数的倍数重新计算概率(228/457)2806(112/428)(228/457)!6.710iifnei5121055,000频率概率泊松统计(主观概率)结果与频率概率接近10/03/20091810/03/200918高斯或正态分布高斯函数具有连续性与对称性,概率密度为221()(;,)exp22xfxdxxxPxE)(][:平均值2222][][])[(][:xExExExV方差在所有统计问题扮演中心角色,应用于所有科学研究领域所涉及的分布。测量误差,特别是仪器误差通常用高斯函数来描述其概率分布。即使在应用中可能有不恰当的地方,仍然可提供与实际情况相近的很好近似。记为N(,)10/03/20091910/03/200919中心极限定理11n2121121iN(0,1)[],[],,nniiiiniiniinniiiiiiinxxxyxEyVy对于个独立的随机变量如果每个都服从平均值为和有限的方差趋于的正分布,那么态因此分布变量如果10/03/20092010/03/200920高斯分布与泊松分布=2=5=10rsuccesses(orfailures)Probability泊松分布高斯分布(=,=)泊松分布只有非负整数定义。高斯分布是连续且可延伸到正负无穷。当泊松分布的平均值越大,与高斯分布的区别就越小。实际应用时,当计数或事例数大于5时,可认为误差满足高斯分布。10/03/20092110/03/200921多维高斯分布对于随机变量其多维高斯函数概率密度为),,(1nxxx)()(21exp||)2(1),;(12/12/xVxVVxfTn相应的平均值与协方差为ijjiiiVxxxE],cov[,][对于二维情形,其概率密度函数可表示为2221112222211122212121212)1(21exp121),,,,;,(xxxxxxf)/(],cov[2121xx10/03/20092210/03/200922二项式,泊松与高斯分布的联系二项式分布泊松分布高斯分布!()(1)!()!nNnNfnppnNn!()nnfne221()(;,)exp22xfx,NNpN10/03/200923对数正态分布如果连续变量y是具有均值为方差为2的高斯量,那么x=ey服从对数正态分布。222211(log)exp0,0(;,)220xxfxx对于其它情况21[]exp()2Ex平均值:22[]exp(2)[exp()1]Vx方差:10/03/200924不同均值和方差的对数正态分布同均值不同方差同方差不同均值0.51.015.00.0.5015对数正态分布表示一个随机变量其对数服从正态(高斯)分布,提供了一个模型处理类似涉及许多小的倍增误差过程的误差。也适用于观测值是一个正比于过去观测的随机变量。xx2(;,)fx2(;,)fx10/03/200925指定区间的对数正态分布计算如果需要估计服从对数正态分布的随机变量在区间(0ab)的概率值,需要计算22211(log)exp22baxdxx对积分做代换y=log(x
本文标题:粒子物理与核物理实验中的数据分析-第3讲-常用概率密度函数
链接地址:https://www.777doc.com/doc-4760656 .html