您好,欢迎访问三七文档
概率密度函数估计第三章概率密度函数的估计贝叶斯估计的基础就是概率密度函数估计当样本数N趋于无穷大时,希望类条件概率密度和先验概率尽可能的精确概率密度函数的估计方法参数估计和非参数估计主要区别就是概率密度函数是否已知i(|)pxi()p3.1引言参数估计的主要方法最大似然估计和贝叶斯估计在数理统计中,用来判断估计好坏的常用标志是无偏性,有效性和一致性。非参数估计主要方法近邻估计法和Parzen窗法NK3.2最大似然估计概率密度函数的形式已知,参数是确定但未知的量样本集的每一个样本都是从密度函数为的总体中独立抽取出来的,即满足独立同分布的条件。i(|)px各类样本只包含本类的分布信息3.2.1似然函数样本集包含N个样本,独立的从概率密度为中获得样本集的概率密度为,即样本集的联合概率密度为(|)px123i1()(|)(,,|)(|)NNilppxxxxpx上式反映的是在不同参数取值下,取得当前样本集的可能性,因此称作参数相对于样本集的似然函数。最大似然估计量123ˆ=d(,,)Nxxxxθ对数似然函数ii11()ln()ln(|)ln(|)NNiiHlpxpx3.2.2似然函数的求解只有一个待估参数()0dld()0dHd或当未知参数是是由多个未知参数组成的向量时,需要对的每一维分别求偏导,即用下面的梯度算子12=,TS12,TSddd来对似然函数或对数似然函数求梯度并令其等于零。()=0()=0lH或注意3.3贝叶斯估计与贝叶斯学习3.3.1贝叶斯估计贝叶斯估计对未知参数的处理方式是把参数本身也看作具有先验分布密度的随机变量,然后根据样本集估计出最优的参数。p()对于连续变量,定义取估计量为所带来的损失为,称为损失函数。ˆθˆ(,)θ在样本X下的条件风险ˆˆ(|)(,)(|)Rpdxxθθ总的期望风险ddˆ(,)(|)()ˆ=(|)()EERppddxRpdxxxxθθ当定义损失函数为时,则在样本X下,贝叶斯估计量是在给定下的条件期望。2ˆˆ(,)()θθx|(|)Epdxx综上所述,在最小平方误差损失函数下,贝叶斯估计步骤:根据对问题的认识确定的先验分布密度()p样本集的联合分布i1(|)(|)Nippx利用贝叶斯公式求参数的后验分布密度(|)()(|)(|)()pppppd参数的贝叶斯估计量为|(|)Epd3.3.2贝叶斯学习样本的概率密度函数为(x|)(|)(|)pppdx参数的后验分布密度(|)()(|)(|)()NNNpppppd由于1(|)(|)(|)NNNppxp可得如下递推公式11(|)(|)(|)(|)(|)NNNNNpxpppxpd(|)(|)()NNppp由递推公式可知,随着样本数目的增加,可以得到一系列对概率密度函数参数的估计11212(),(|),(|,),(|,)Nppxpxxpxxx0513200.20.40.60.81.01.21.41.61.82.00.04-5-1-2-30-4)|(NXp随着样本数目的增加后验分布密度逐渐形成以的真实值为中心的一个尖峰。当样本无穷时收敛于参数真实值上的脉冲函数,这一过程称作贝叶斯学习。(|)()Npxpx3.4概率密度估计的非参数方法基本原理某个随机向量落入某个小区域R的概率()RRPpxdx在样本集为N,实际落入小区域有k个样本时的一个很好的估计是RPkˆRPN当连续、且小区域R的体积V足够小时则随机向量落入这个区域的概率为(x)p()=()RRPpxdxpxV此时其估计量变为kˆ(x)PNV当样本无穷多时,收敛于的条件是ˆ(x)Pp()xlim0NNVlimkNNklim0NNN近邻估计法kN密度函数的估计为:kˆ()NPxNVParzen窗法小舱体积VdVh定义d维单位方窗函数1211,1,2,,(,,,)20idjd若其它则落入以x为中心的超立方体内的样本数就可以写成1k=()NiNixxh由此可推出任意一点x的密度函数估计表达式为11111ˆˆ()()()()NNiiiixxxxPxPxNVhNVh或定义核函数(窗函数)1k(,)()iixxxxVh则任一点的函数密度估计写为111ˆ()k(,)NiiPxxxN基本要求11k(,)0k(,)0iixxxxdx且谢谢观看
本文标题:密度函数估计
链接地址:https://www.777doc.com/doc-4019192 .html