您好,欢迎访问三七文档
MCMC方法——MarkovChainMonteCarlo方法——马尔科夫链蒙特卡洛方法蒙特卡洛方法1.也称为静态的计算机随机模拟方法.2.它从目标分布f中随机抽取的的模拟。3.在推断性的统计分析中很多感兴趣的量能够表示为某随机变量的函数的期望E{h(X)}通过弱大数定理:12,,.....nxxx11{()}()niiEhXhXnMC方法实例•计算定积分第一种方法:随机投点法第二种方法:平均值估计法a.产生均匀随机数b.计算c.令则10()Ifxdx0,112,,.....nrrr()ifr11()niihrnI贝叶斯统计1.基于总体信息,样本信息,先验信息进行的统计推断被称为贝叶斯统计学2.贝叶斯统计与经典统计的区别是引入了先验信息。3.贝叶斯推断的一般模式:先验信息后验信息=后验信息或者这里的表示贝叶斯定理的作用()()()xx贝叶斯学派认为任意未知参数都可以看作随机变量,可以用概率分布来描述任一变量的不确定性。则可以认为这里可以得到则可以得到函数的后验分布的期望为()()()()()ppDpDppDd(,)()pDppD()()()(())()()fppDdEfDppDd•在这里我们让代表m维的随机变量•用后验分布来描述对未知参数的认识,显得比频率学派通过用统计量来描述更自然些.()(())fdEfDdMarkovChain•定义:MCMC方法1.MCMC方法的基本思想就是构造一个平稳分布为马氏链来得到的样本。2.MCMC方法也称为动态的蒙特卡洛方法。3.基于贝叶斯推断原理的MCMC方法主要是用于产生后验分布的样本xxMCMC的三步走第一步选一个“合适”的马氏链;“合适”是指建立一个平稳分布为的马氏链第二步由X中的某一点出发,由第一步中的马氏链产生点序列第三步对某个m和比较大得n,任一函数h(X)的期望估计如下x0x12,,.....nxxx11()niimEhhxnmM-H算法的伪代码为:1.初始化2.从t=0到N-1…...采样…...采样从…...如果否则0x0,1U*xu1*txx1ttxx****()()(,){1,}()()ttttfxgxxuAxxfxgxx*()tgxxM-H算法几点注意的问题第一点M-H算法虽然简单,但需要认真设计提案分布第二点链的个数第三点马氏链的长度n多大才算合适?提案分布提案分布的选取对于M-H抽样是非常关键的,现在比较流行的采样方案有:a.独立马氏链采样提案分布为某个固定的密度函数g,使得满足,由提案分布产生一个独立链,其中抽取的每一个候选值与前面的候选值相互独立,在这种情况下***()()(,)()()tttfxgxRxxfxgx**()()tgxxgxb.随机游走采样1.通过简单变化M-H算法得到的另一种马氏链2.令通过抽取~,h为密度函数则对于h的一般选择包括以圆点为球心得球面上的均匀分布。*txx*x()h链的个数•实际中遇到链是否长期停留在一个或多个目标函数的峰附近。•一个解决该问题的方法是运行多个具有不同初始值的链,并比较其链内和链间的表现情况。运行多个链1.关于预烧期和运行长度的确定是当前活跃的研究领域。我们通常会舍弃链的前D个值,就是所谓的预烧期。2.一个常用的方法由Gelman和Rubin提出。这个方法中,MCMC算法由J个等长的链组成。令L表示舍去D个迭代之后每个链的长度。假设其在第j个链上的第t个迭代值为tjx一个常用的方法由Gelman和Rubin提出。这个方法中,MCMC算法由J个等长的链组成。令L表示舍去D个迭代之后每个链的长度。假设其在第j个链上的第t个迭代值为舍弃D个迭代值而剩下L个值tjx012,,...Djjjjxxxx121,...DDDLjjjxxx令第j个链的平均值再定义并定义链间方差为现第j个链的链内方差为则J个链的链内方差估计的平均值为11DLtjjtDxxL.11JjjxxJ.1()1JjjLBxxJ122.1()1DLtjjtDsxxL211JjjWsJ最后令统计量a.但如果链间有显著的差异,则分子将会比分母大。随着。b.实际应用中可以接受。c.如果选定的预烧期不能得到令人接受的结果,则或者增大D,或者增大L,或者两者同时增加。d.一个保守的做法是将迭代的前一半都当做预烧期。11LWBLLRW,1LR1.2R
本文标题:MCMC
链接地址:https://www.777doc.com/doc-1352102 .html