您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 第二章 蒙特卡罗方法
第二章蒙特卡罗方法(又统称:统计试验方法)在第一章我们看到了关于解决反问题在概率分布模型空间最普遍的方案,当它的概率分布唯一时,在模型空间是非常简单的,(例如,它仅有一个最大值),可以用分析技术来表示。对于一般的概率分布,需要在模型空间上广泛的探索,除去维数较小的,因为这样不能系统概括,(根据位数空间大量的点群)设计好随机(或非随机)可以探索解决了许多复杂的问题,这些随机方法被洛斯阿拉莫斯团队开玩笑的叫做“蒙特卡洛方法”,Metropplis抽样算法,现在已经建立被叫做“蒙特卡罗”。2.1介绍几个世纪前蒙特卡罗(即随机的)方法就被用于计算,例如,可以用蒙特卡罗方法来估算:对于一个普通的楼层,等同宽度W的钢带,抛出长为W/2的针,这个针相交的凹槽,在地板上的概率等于1(勒克莱尔,乔治.路易伯爵布冯[1907至88年])。以50为一系列做观察,做100次试验,在1850年由沃尔夫在苏黎世导致对3.15960.0524的值。在数值方法中,针的行进被替换一个随机生成的数字,由计算机的代码一个域,其中蒙特卡罗计算是平时对于数值计算大维空间积分:函数在一个普通的系统评价网格是不可能的(太多了点就被要求),并在蒙特卡罗采样功能可以提供的结果的估计值,连同误差的估计值(见附录6.9或了解更多详情,卡洛什和惠特洛克,1986)。对于反问题的解决方案采用蒙特卡罗方法是由开始BorokKeilisavaandYanovsk(1967)和出版社(1968,1971)。最近的rkserestingwoint是安德森和Seneta(1971,1972),罗斯曼(1985年,1985年b,1986)和JensenDah1的等(1998)。这本书,过参数,其中概率分布的透视空间是核心,我们面临着如何使用它们的问题。对“中心估计”的定义(如均值或中位数)的“分散的估计”(如协方差和矩阵)缺乏通用性,因为它是很容易找到的例子(如多模态分布在高维空间),其中这些估计不能有任何有趣的含义。当一个概率分布已被定义在低维空间(比方说,从一维到四维),我们可以直接表示关联概率密度。这是微不足道的一维或两维。它很容易在三维空间中,并且一些花样可以允许我们表示了四维概率分布。此外,事件A的概率可直接通过一个整体的,使用标准来评价(非随机的)数值方法。图2.1。的采样,概率密度使我们在计算中引入了概率理论(计算一个事件的概率使用估计某些时刻,等)简单的统计。在模型空间中有很高的维数,代表一个概率密度是不可能的,但我么可以,至少在原则上,做些变换在很大程度是等价的。我们可以用27sample概率密度,如图2.1中的建议。优先考虑一组概率分布的样本是单个“点”来表示,通常如图像,如2.2(2.5右边的图像)。对于高维空间问题很容易被低估,他们通常是趋于空的,图2.3表明,偶然触及的概率(最大值)超球面镌刻在超立方体迅速降低到零维空间的生长。当目标不是一个大领域,但一个小区域图2.3表明,偶然触及的概率(最大值)超球面镌刻在超立方体迅速降低到零维空间的生长。当目标不是一个大领域,但一个小区域如图2.2,,9随机实现超过36的概率分布—三维空间。36值实际上是价值在6×6阵列,价值观是事实上的值在6-6矩阵,当值使用灰度等级表示,每个实现图像。请注意,大多数的图像提出了一个“十字”(突出)。同时,在下面的两行的像素,往往对应于较高的随机变量的值(灰色阴暗的等级)。给出了足够的样本,不同事件的概率可以被评估,例如,(i),希腊十字可能出现的概率,(ii)一个希腊十字架的概率图像的左边(通常是在右边),(iii)的概率有希腊十字,在同一时间,在图表的底部低值的变量,等图2.3,高维空间往往是很空的。击球偶然的正方形的内切圆是很容易的。偶然的机会球内接打在一个立方体是一点点困难。当空间维度的增加,刻的超球面击中的概率在超立方体迅速趋向于零。在顶部,超球面的体积并给出了应用超立方体的一个函数维度的n,底部底部的体积比显示xplainswhy。这个数字解释了为什么探索随机在高维空间是很困难的,为什么要使用布朗运动解决随机探索。维数立方体的超球面:)2(22nnrnn立方体的体积:nr)2(概率显示,它是很容易理解的,蒙特卡罗方法,可以用在高维空间是微不足道的。事实上,在一个大的三维空间中蒙特卡罗的抽样概率分布的两个问题:(i)定位的区域(S)的概率,和(ii)采样的整个区域(S)足够密度。寻找区域的位置是最困难的问题,数学是不能单独解决的(因为它大维空间大空):它是特定的物理(或结构)的,在一方面,可能有助于这一问题。一旦你已经能够接近一个这些地区,下面描述的技巧(吉布斯抽样和Metropolis算法)是能够执行一个随机变量,布朗运动的有效的探索区域,避免把它(从而进入空间的空旷地区)。2.2电影策略的逆问题在第一章我们看到逆命题的两个典型的输入一个是概率密度)(mM,描述了检验信息的模型参数,和一个概率密度)(dD,我们对参数信息进行描述,通过一些数据获得了,逆问题的解决方案是由一个(后概率密度)概率密度)(mM等于(规范)先检验概率产品的密度,)(mM次一个似然函数)(mL:).()()(mLmMkmM(2.1)似然函数是衡量好模型m拟合数据。的可以编写规范不变)()(1mLmMdmmk在大多数集合中,数据和模型参数之间的关系的概率并通过一个条件概率密代表(md)。然后,似函数(见方程(1.89)-(1.91))DdDmddDddmL)()()()((2.2)其中)(dD是在该数据流形的均匀概率密度。有时候,数据和模型参数之间是有关系的,)(mgd,这种情况下,似然函数(见方程(1.93)-(1.95))。))(()(mgDmL(2.3)几个例子的似然函数给出footnote.28的方法对开发需要的值的计算可能在许多点,将可能性的表达形式(2.2)或(2.3)是不太相干的.在这一章中,我们将介绍的方法,让我们先索取样品,...}2,1{MM的先验概率密度的)(mM,然后样品{,21,mm}后验概率密度.)(mM因为,通常,每个样品(即,每个模型)可以被表示为一个图像,许多样品显示对应的显示“电影”。让我们开始讨论“前代”电影。显示(研究)的样本)(mM让我们确认使用适当的先验信息。它可以帮助传达给别人哪一种先验信息我们已经记住(和也许允许这些人批评先验我们正试图用信息)。我们已经看到了三个样本的一个例子先验概率分布在例1.32,三个地球分层模型显示(图1.10,30页)。让我们看看另一个简单的例子。例2.1。高斯随机场,高斯随机场的特点是它的平均场)(xMmean及其协方差),(XXCM。考虑到这些,可以生成尽可能多的随机随机领域的实现一个可能希望(使用,例如,方法建议在下面示例2.2)。图2.4显示了三个随机的实现高斯随机场的零均值和球形ariancecov29(编码值颜色范围内)。给定一个足够大的数量的实现,意味着领域和协方差是容易估计(使用简单的统计数据),一个足够大的号码实现完全是随机的。因为的协方差随机场是静止不动的,三张图片已经传达的一个好主意随机领域本身。需要更多的图片更一般的协方差。的显示这些样本的先验概率分布允许其他科学家评估的正确性先验信息被输入到反问题(实际(未知的)字段是一个随机实现这样一个随机领域)。显示平均协方差的高斯随机场和策划不是一个选择显示一定数量的实现,因为均值和协方差不相关一个直观的方式实考虑到这些,可以生成尽可能多的随机随机领域的实现一个可能希望(使用,例如,方法建议在下面示例2.2)。图2.4显示了三个随机的实现高斯随机场的零均值和球形ariancecov29(编码值颜色范围内)。给定一个足够大的数量的实现,意味着字段和协方差是容易估计(使用简单的统计数据),一个足够大的号码实现完全是随机的。因为协方差随机场是静止不动的,三张图片已经传达的一个好主意随机领域本身。需要更多的图片更一般的协方差。显示这些样本的先验概率分布允许其他科学家评估的正确性先验信息被输入到反问题(实际(未知的)字段是一个随机实现这样一个随机领域)。显示平均协方差的高斯随机场和策划不是一个选择显示一定数量的实现,因为均值和协方差不相关一个直观的方式实现.图2.4。三个随机实现的二维高斯随机的字段。平均场是零,(静止)协方差之和白噪声加一个球形的协方差。(a·鲍彻,珀耳斯。通信).当显示样本的先验概率密度的问题)(mM被解决(已达成协议的存在和适用性先验信息),一个可能产生样本的后验概率密度)(mM。生产的一般方法只对这些样本的后验分布介绍了下面的部分,但我们可以检查下面的一个非常简单的例子反问题,这些样本的生成可以通过使用一个简单的理论。实例2.2。采样条件高斯随机领域。让我们简要探讨在这里,一个简单的逆问题,具有很高的教学价值。我们面对一个未知的二维领域被假定为一个随机的高斯随机领域实现了2.1例(三随机字段的随机实现,在图2.4中显示的)。图2.5。从一个随机的高斯随机字段中描述的实现在图2.4中,50的值显示在左上方被提取作为数据。的特定随-机实现,用于获取这些数据是我们未知的,但的均值和协方差的高斯随机领域了。现有的高斯领域(如它的均值和协方差的定义)然后条件与给定的数据(对应于一个简单的逆问题的解决方案)。通过这种方式,一个后高斯场的定义意味着)(~xmeanM和协方差),(~XXCM可以表达(有关详细信息,请参阅文本)。而不是直接成为这个后验均值和感兴趣协方差,它是更好的生成一些随机抽样后的高斯随机的,我们知道均值和协方差。9这些随机实现显示在右边的图。所有这些实现满足50初始数据值。实际实现的50个数据值提取可能类似任何一种实现(事实上,这是一个在左边图2.4)。这九面板传达一个清晰的概念变化的解决问题的办法.我们得到的数据,如,K值)}(,),(),({21kxmxmxm的未知的实现)(xm在点),,,{21kxxx如果这些值被假定为是准确众所周知,我们可以通过从现有的随机场后的随机场只是用条件概率的概念。如果值是唯一已知的一些不确定性,这后的随机场可以得到逆问题的设置,基本上是使用第三方程(1.106)和第二组(1.107)(见135页的例5.25这个问题的一个显式)。在任何情况下,我们结束了一个后验高斯。随机领域,其中我们可以表达的是什么意思?)(~xmmean和协方差),(~XXCM。但是,再一次,而不是代表均值和分析协方差,最好是产生随机字段,可以做如下的实现。采取随机一个点ax的在空间。在这一点上,我们有一个均值高斯随机变量平均)(~xmmean和方差),(~XXCM。这样,就可以生成随机实现这个一维随机变量的这将使一些值)(axm。我们开始该问题与在k个点给出的领域的值。我们现在有的值在领域1k个点给出。这个问题就可以使用第1k个点改写,和同样的方法可以用来随机生成在某个点bx一个新值,并依此类推,直到我们实现了随机场在尽可能多的积分值,我们不妨。图2.5给出了该算法的二维空间的实际实施,开始,在50分中给出的领域的值。从上面的例子中,读者应记,反问题的解决方案,作为一个概率分布,是从来没有的一个图像,而是一组图像,样品后验概率密度)(mM。策划了“最佳形象”的普遍做法或“平均形象”应该被抛弃,即使伴随着一定的误差分析和分辨率。例如,使用最小二乘法时,制订的问题在该实施例中所述,所谓的溶液是后的均值高斯分布,即,在图2.5的左栏中间的平滑图像。这是不该解决方案;当然,它是所有可能的解决方案的平均值(因此其平滑性)。展望这意味着提供了比看电影变现的信息要少得多。记即,通过构造中,每个实现中的捕获的基本随机波动在实际的现场,从该数据中提取(左侧图2.4)。对于这样的影片(在地球物理上下文)的生成的另一示例,请参见科伦等。(1991)当随机模型的这样一个(足够大)集合可用,我们也可以回答很有意思的问题。例如,在一个构造模型,有人会问,在哪深度是地下结构
本文标题:第二章 蒙特卡罗方法
链接地址:https://www.777doc.com/doc-4047328 .html